第11章 インスタンス用の仮想 GPU の設定
インスタンスで GPU ベースのレンダリングをサポートするには、利用可能な物理 GPU デバイスおよびハイパーバイザーの種別に応じて、仮想 GPU (vGPU) リソースを定義し、管理できます。この設定を使用すると、すべての物理 GPU デバイス間でレンダリングワークロードを効果的に分散し、vGPU 対応インスタンスのスケジューリングを制御できます。
Compute サービス (nova) で vGPU を有効にするには、次のタスクを実行します。
- vGPU を設定するノードを特定します。
- 各コンピュートノード上の各物理 GPU の PCI アドレスを取得します。GPU が SR-IOV をサポートしている場合は、各 SR-IOV Virtual Function (VF) の PCI アドレスを取得します。
- 各コンピュートノードで GPU プロファイルを設定します。
設定されたコンピュートノードでホストされる各インスタンスは、物理 GPU デバイスに対応する仮想 GPU デバイスを使用して GPU ワークロードをサポートできます。
Compute サービス (nova) は、各ホストに定義する GPU プロファイルで利用可能な仮想 GPU デバイスの数を追跡します。Compute サービスは、これらのホストにインスタンスをスケジュールし、デバイスを接続し、仮想 GPU の使用状況を監視します。インスタンスが削除されると、Compute サービスは仮想 GPU デバイスを利用可能なプールに戻します。
Red Hat は、サポート例外を必要としない RHOSO で NVIDIA vGPU の使用を有効化します。ただし、Red Hat は、NVIDIA 仮想 GPU ドライバーのテクニカルサポートを提供しません。NVIDIA 仮想 GPU ドライバーは、NVIDIA により提供され、サポートされます。NVIDIA 仮想 GPU ソフトウェアの NVIDIA Enterprise サポートを取得するには、NVIDIA 認定サポートサービスサブスクリプションが必要です。サポートされるコンポーネントで問題を再現できない NVIDIA 仮想 GPU の使用から生じる問題には、以下のサポートポリシーが適用されます。
- サードパーティーコンポーネントが問題に関与していないと Red Hat が考える場合は、通常の サポート対象範囲 および Red Hat SLA が適用されます。
- サードパーティーコンポーネントが問題に関与していると Red Hat が考える場合は、お客様は Red Hat の サードパーティーサポートおよび認定ポリシー に従って NVIDIA に問い合わせを依頼されます。詳細は、ナレッジベースの記事 Obtaining Support from NVIDIA を参照してください。
11.1. vGPU デバイスでサポートされている設定と制限 リンクのコピーリンクがクリップボードにコピーされました!
- サポートされる GPU カード
- サポートされる NVIDIA GPU カードのリストは、NVIDIA の Web サイトで Virtual GPU Software Supported Products を参照してください。
- 仮想 GPU デバイスを使用する際の制限
- 各インスタンスが使用できる仮想 GPU のリソースは 1 つだけです。
- ホスト間の vGPU インスタンスのライブマイグレーションはサポートされていません。
- vGPU インスタンスの退避はサポートされていません。
仮想 GPU インスタンスをホストするコンピュートノードをリブートする必要がある場合、仮想 GPU は自動的に再作成されたインスタンスに再割り当てされません。コンピュートノードをリブートする前にインスタンスのコールドマイグレーションを行うか、リブート後に各仮想 GPU を正しいインスタンスに手動で割り当てる必要があります。各仮想 GPU を手動で割り当てるには、リブートする前にコンピュートノードで実行される各仮想 GPU インスタンスのインスタンス XML から
mdevUUID を取得する必要があります。以下のコマンドを使用して、各インスタンスのmdevUUID を検出することができます。# virsh dumpxml <instance_name> | grep mdev<instance_name>を、Compute API への/serversリクエストで返される libvirt インスタンス名 (OS-EXT-SRV-ATTR:instance_name) に置き換えます。- デフォルトでは、コンピュートホストの仮想 GPU の種別は API ユーザーに公開されません。コンピューティングホスト上の vGPU タイプを API ユーザーに公開するには、リソースプロバイダーの特性を設定し、その特性を必要とするフレーバーを作成する必要があります。また、vGPU タイプが 1 つしかない場合は、ホストをホストアグリゲートに追加することでアクセスを許可できます。詳細は、Creating and managing host aggregates を参照してください。
- NVIDIA アクセラレーターハードウェアを使用する場合は、NVIDIA ライセンス要件に従う必要があります。たとえば、NVIDIA vGPU GRID にはライセンスサーバーが必要です。NVIDIA のライセンス要件の詳細は、NVIDIA の Web サイトで NVIDIA License Server Release Notes を参照してください。