본문으로 건너뛰기

AMD GPU Operator 설치 가이드

설치

경고

cert-manager가 설치되어있어야 합니다.

helm repo add rocm https://rocm.github.io/gpu-operator
helm repo update rocm \
&& helm search repo rocm/gpu-operator-charts -l | head -n 10
helm pull rocm/gpu-operator-charts --version v1.3.1
helm show values rocm/gpu-operator-charts --version v1.3.1 > gpu-operator-1.3.1.yaml

device plugin 들이 Node feature Discovery를 사용하는 경우가 많기 때문에 따로 설정해서 설치하는 것을 권장합니다.

gpu-operator-values.yaml
node-feature-discovery:
enabled: false
helm template gpu-operator rocm/gpu-operator-charts \
--version v1.3.1 \
-n amd-gpu \
-f gpu-operator-values.yaml \
> gpu-operator.yaml
helm upgrade gpu-operator rocm/gpu-operator-charts \
--install \
--history-max 5 \
--version v1.3.1 \
-n amd-gpu \
-f gpu-operator-values.yaml