9.18.9.2. NVIDIA GPU Operator を使用する
NVIDIA GPU Operator を使用して、OpenShift Virtualization で GPU 高速化仮想マシンを実行するためのワーカーノードをプロビジョニングできます。
NVIDIA GPU Operator は、OpenShift Container Platform クラスター内の NVIDIA GPU リソースを管理し、GPU ワークロード用にノードを準備する際のタスクを自動化します。NVIDIA GPU Operator は、複雑な人工知能および機械学習 (AI/ML) ワークロードのプロビジョニングを容易にすることも可能です。
NVIDIA GPU Operator については、NVIDIA からサポートを受けることができます。詳細は、Red Hat ナレッジベースの「Obtaining Support from NVIDIA」を参照してください。
手順
ClusterPolicyマニフェストを設定します。ClusterPolicyマニフェストは、提供されている例と一致している必要があります。apiVersion: nvidia.com/v1 kind: ClusterPolicy metadata: name: gpu-cluster-policy spec: daemonsets: updateStrategy: RollingUpdate dcgm: enabled: true dcgmExporter: {} devicePlugin: {} driver: enabled: false kernelModuleType: auto gfd: {} mig: strategy: single migManager: enabled: true nodeStatusExporter: enabled: true operator: defaultRuntime: crio initContainer: {} runtimeClass: nvidia use_ocp_driver_toolkit: true sandboxDevicePlugin: enabled: true sandboxWorkloads: defaultWorkload: vm-vgpu enabled: true toolkit: enabled: true installDir: /usr/local/nvidia validator: plugin: env: - name: WITH_WORKLOAD value: "true" vfioManager: enabled: true vgpuDeviceManager: config: default: default name: vgpu-devices-config enabled: true vgpuManager: enabled: true image: <vgpu_image_name> repository: <vgpu_container_registry> version: <nvidia_vgpu_manager_version>各項目の説明:
<vgpu_image_name>- 仮想 GPU イメージ名を指定します。
<vgpu_container_registry>- 仮想 GPU コンテナーのレジストリー値を指定します。
<nvidia_vgpu_manager_version>- NVIDIA の Web サイトからダウンロードし、イメージのビルドに使用した仮想 GPU ドライバーのバージョンを指定します。
- NVIDIA GPU Operator を使用して、仲介デバイスを設定します。詳細は、NVIDIA GPU Operator with OpenShift Virtualization を参照してください。