7.14.11. PCI 패스스루 구성
PCI(Peripheral Component Interconnect) 패스스루 기능을 사용하면 VM(가상 머신)에서 하드웨어 장치에 액세스하고 관리할 수 있습니다. PCI 패스스루가 구성되면 PCI 장치는 게스트 운영 체제에 물리적으로 연결된 것처럼 작동합니다.
클러스터 관리자는 oc CLI(명령줄 인터페이스)를 사용하여 클러스터에서 사용할 수 있는 호스트 장치를 노출하고 관리할 수 있습니다.
7.14.11.1. GPU 패스스루를 위한 노드 준비 링크 복사링크가 클립보드에 복사되었습니다!
GPU 피연산자가 GPU 패스스루용으로 지정한 작업자 노드에 배포되지 않도록 할 수 있습니다.
7.14.11.1.1. NVIDIA GPU 피연산자가 노드에 배포되지 않도록 방지 링크 복사링크가 클립보드에 복사되었습니다!
클러스터에서 NVIDIA GPU Operator 를 사용하는 경우 nvidia.com/gpu.deploy.operands=false 레이블을 GPU 또는 vGPU 피연산자에 대해 구성하지 않으려는 노드에 적용할 수 있습니다. 이 레이블은 GPU 또는 vGPU 피연산자를 구성하는 Pod 생성을 방지하고 이미 존재하는 경우 Pod를 종료합니다.
사전 요구 사항
-
OpenShift CLI(
oc)가 설치되어 있어야 합니다.
프로세스
다음 명령을 실행하여 노드에 레이블을 지정합니다.
$ oc label node <node_name> nvidia.com/gpu.deploy.operands=false1 - 1
- &
lt;node_name>을 NVIDIA GPU 피연산자를 설치하지 않으려는 노드의 이름으로 바꿉니다.
검증
다음 명령을 실행하여 라벨이 노드에 추가되었는지 확인합니다.
$ oc describe node <node_name>선택 사항: GPU 피연산자가 이전에 노드에 배포된 경우 제거를 확인합니다.
다음 명령을 실행하여
nvidia-gpu-operator네임스페이스에서 Pod의 상태를 확인합니다.$ oc get pods -n nvidia-gpu-operator출력 예
NAME READY STATUS RESTARTS AGE gpu-operator-59469b8c5c-hw9wj 1/1 Running 0 8d nvidia-sandbox-validator-7hx98 1/1 Running 0 8d nvidia-sandbox-validator-hdb7p 1/1 Running 0 8d nvidia-sandbox-validator-kxwj7 1/1 Terminating 0 9d nvidia-vfio-manager-7w9fs 1/1 Running 0 8d nvidia-vfio-manager-866pz 1/1 Running 0 8d nvidia-vfio-manager-zqtck 1/1 Terminating 0 9dTerminating상태의 Pod가 제거될 때까지 Pod 상태를 모니터링합니다.$ oc get pods -n nvidia-gpu-operator출력 예
NAME READY STATUS RESTARTS AGE gpu-operator-59469b8c5c-hw9wj 1/1 Running 0 8d nvidia-sandbox-validator-7hx98 1/1 Running 0 8d nvidia-sandbox-validator-hdb7p 1/1 Running 0 8d nvidia-vfio-manager-7w9fs 1/1 Running 0 8d nvidia-vfio-manager-866pz 1/1 Running 0 8d