第6章 Dynamic Accelerator Slicer (DAS) Operator
Dynamic Accelerator Slicer Operator はテクノロジープレビュー機能のみです。テクノロジープレビュー機能は、Red Hat 製品のサービスレベルアグリーメント (SLA) の対象外であり、機能的に完全ではないことがあります。Red Hat は、実稼働環境でこれらを使用することを推奨していません。テクノロジープレビュー機能は、最新の製品機能をいち早く提供して、開発段階で機能のテストを行い、フィードバックを提供していただくことを目的としています。
Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲 を参照してください。
Dynamic Accelerator Slicer (DAS) Operator を使用すると、ノードの起動時に定義された静的にスライスされた GPU に依存するのではなく、OpenShift Container Platform で GPU アクセラレーターを動的にスライスできます。これにより、特定のワークロード需要に基づいて GPU を動的にスライスし、リソースを効率的に使用できるようになります。
動的スライスは、クラスター内のすべてのノードで事前に必要なすべてのアクセラレーターパーティションがわからない場合に役立ちます。
現在、DAS Operator には NVIDIA Multi-Instance GPU (MIG)の参照実装が含まれており、今後他のベンダーからの NVIDIA MPS や GPU などの追加のテクノロジーをサポートするように設計されています。
制限事項
Dynamic Accelerator Slicer Operator を使用する場合は、以下の制限が適用されます。
- 潜在的な非互換性を特定し、システムがさまざまな GPU ドライバーおよびオペレーティングシステムでシームレスに動作することを確認する必要があります。
- Operator は、H100 や A100 などの特定の MIG と互換性のある NVIDIA GPU およびドライバーでのみ動作します。
- Operator は、ノードの GPU のサブセットのみを使用することはできません。
- NVIDIA デバイスプラグインは、Dynamic Accelerator Slicer Operator と組み合わせて使用してクラスターの GPU リソースを管理することはできません。
DAS Operator は、MIG 対応の GPU で動作するように設計されています。GPU 全体ではなく、MIG スライスを割り当てます。DAS Operator をインストールすると、GPU 全体の割り当てに nvidia.com/gpu: "1"
などの NVIDIA デバイスプラグインを介した標準のリソース要求の使用が妨げられます。
6.1. Dynamic Accelerator Slicer Operator のインストール リンクのコピーリンクがクリップボードにコピーされました!
クラスター管理者は、OpenShift Container Platform Web コンソールまたは OpenShift CLI を使用して Dynamic Accelerator Slicer (DAS) Operator をインストールできます。
6.1.1. Web コンソールでの Dynamic Accelerator Slicer Operator のインストール リンクのコピーリンクがクリップボードにコピーされました!
クラスター管理者は、OpenShift Container Platform Web コンソールを使用して Dynamic Accelerator Slicer (DAS) Operator をインストールできます。
前提条件
-
cluster-admin
パーミッションを持つアカウントを使用して OpenShift Container Platform クラスターにアクセスできる。 必要な前提条件がインストールされている。
- cert-manager Operator for Red Hat OpenShift
- Node Feature Discovery (NFD) Operator
- NVIDIA GPU Operator
- NodeFeatureDiscovery CR
手順
MIG をサポートするように NVIDIA GPU Operator を設定します。
-
OpenShift Container Platform Web コンソールで、Operators
Installed Operators に移動します。 - インストールされている Operator の一覧から NVIDIA GPU Operator を選択します。
- ClusterPolicy タブをクリックし、Create ClusterPolicy をクリックします。
YAML エディターで、デフォルトのコンテンツを以下のクラスターポリシー設定に置き換えて、デフォルトの NVIDIA デバイスプラグインを無効にし、MIG サポートを有効にします。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - Create をクリックして、クラスターポリシーを適用します。
-
Workloads
Pods に移動し、 nvidia-gpu-operator
namespace を選択して、クラスターポリシーのデプロイを監視します。 NVIDIA GPU Operator クラスターポリシーが
Ready
状態になるまで待ちます。これは、以下の方法でモニターできます。-
Operators
Installed Operators NVIDIA GPU Operator に移動します。 -
ClusterPolicy タブをクリックし、ステータスに
ready
が表示されていることを確認します。
-
Operators
-
nvidia-gpu-operator
namespace を選択し、WorkloadsPods に移動して、NVIDIA GPU Operator namespace のすべての Pod が実行されていることを確認します。 MIG モードを有効にするために MIG 対応 GPU でノードにラベルを付けます。
-
Compute
Nodes に移動します。 - MIG 対応 GPU を持つノードを選択します。
-
Actions
Edit Labels をクリックします。 -
ラベル
nvidia.com/mig.config=all-enabled
を追加します。 - Save をクリックします。
MIG 対応の GPU が設定された各ノードで繰り返します。
重要MIG ラベルを適用すると、ラベルが付けられたノードが再起動し、MIG モードが有効になります。ノードがオンラインに戻るのを待ってから続行します。
-
Compute
-
nvidia.com/mig.config=all-enabled
ラベルが Labels セクションに表示されることを確認して、GPU ノードで MIG モードが正常に有効になっていることを確認します。ラベルを見つけるには、ComputeNodes に移動し、GPU ノードを選択して、Details タブをクリックします。
-
OpenShift Container Platform Web コンソールで、Operators
-
OpenShift Container Platform Web コンソールで、Operators
OperatorHub をクリックします。 - フィルターボックスで Dynamic Accelerator Slicer または DAS を検索し、DAS Operator を見つけます。
- Dynamic Accelerator Slicer を選択し、Install をクリックします。
Install Operator ページで以下を行います。
- インストールモードの場合は、All namespaces on the cluster (default) を選択します。
-
Installed Namespace
Operator recommended Namespace: Project das-operator を選択します。 -
新規 namespace を作成する場合、名前空間名として
das-operator
を入力します。 - 更新チャネルを選択します。
- 承認ストラテジーの場合は、Automatic または Manual を選択します。
- Install をクリックします。
-
OpenShift Container Platform Web コンソールで、Operators
Installed Operators をクリックします。 - リストから DAS Operator を選択します。
- Provided APIs テーブルの列で、DASOperator をクリックします。これにより、Operator details ページの DASOperator タブに移動します。
- Create DASOperator をクリックします。これにより、Create DASOperator YAML ビューに移動します。
YAML エディターで、以下の例を貼り付けます。
DASOperator
CR の例Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 1
DASOperator
CR の名前はcluster
でなければなりません。
- Create をクリックします。
検証
DAS Operator が正常にインストールされていることを確認します。
-
Operators
Installed Operators ページに移動します。 -
Status が Succeeded で、Dynamic Accelerator Slicer が
das-operator
namespace に一覧表示されていることを確認します。
DASOperator
CR が正常にインストールされていることを確認するには、以下を実行します。
-
DASOperator
CR を作成すると、Web コンソールで DASOperator リストビュー が表示されます。すべてのコンポーネントが実行されている場合、CR の Status フィールドが Available に変わります。 オプション: OpenShift CLI で次のコマンドを実行して、
DASOperator
CR が正常にインストールされていることを確認できます。oc get dasoperator -n das-operator
$ oc get dasoperator -n das-operator
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 出力例
NAME STATUS AGE cluster Available 3m
NAME STATUS AGE cluster Available 3m
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
インストール時に、Operator は Failed ステータスを表示する可能性があります。その後インストールが成功し、Succeeded メッセージが表示された場合は、Failed メッセージを無視できます。
Pod を確認してインストールを検証することもできます。
-
Workloads
Pods ページに移動し、 das-operator
namespace を選択します。 すべての DAS Operator コンポーネント Pod が実行されていることを確認します。
-
das-operator
Pod (main Operator コントローラー) -
das-operator-webhook
Pod (webhook サーバー) -
das-scheduler
Pod (scheduler プラグイン) -
Das-daemonset
Pod (MIG 互換の GPU を持つノードのみ)
-
das-daemonset
Pod は、MIG 互換の GPU ハードウェアを持つノードにのみ表示されます。daemonset Pod が表示されない場合は、クラスターにサポート対象の GPU ハードウェアを持つノードがあり、NVIDIA GPU Operator が適切に設定されていることを確認します。
トラブルシューティング
Operator がインストールされていないと思われる場合は、次の手順を使用します。
-
Operators
Installed Operators ページに移動し、Operator Subscriptions および Install Plans タブで Status にエラーがあるかどうかを検査します。 -
Workloads
Pods ページに移動し、 das-operator
namespace で Pod のログを確認します。
6.1.2. CLI を使用した Dynamic Accelerator Slicer Operator のインストール リンクのコピーリンクがクリップボードにコピーされました!
クラスター管理者は、OpenShift CLI を使用して Dynamic Accelerator Slicer (DAS) Operator をインストールできます。
前提条件
-
cluster-admin
パーミッションを持つアカウントを使用して OpenShift Container Platform クラスターにアクセスできる。 -
OpenShift CLI (
oc
) がインストールされている。 必要な前提条件がインストールされている。
- cert-manager Operator for Red Hat OpenShift
- Node Feature Discovery (NFD) Operator
- NVIDIA GPU Operator
- NodeFeatureDiscovery CR
手順
MIG をサポートするように NVIDIA GPU Operator を設定します。
以下のクラスターポリシーを適用して、デフォルトの NVIDIA デバイスプラグインを無効にし、MIG サポートを有効にします。以下の内容で
gpu-cluster-policy.yaml
という名前のファイルを作成します。Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下のコマンドを実行してクラスターポリシーを適用します。
oc apply -f gpu-cluster-policy.yaml
$ oc apply -f gpu-cluster-policy.yaml
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 次のコマンドを実行して、NVIDIA GPU Operator クラスターポリシーが
Ready
状態になったことを確認します。oc get clusterpolicies.nvidia.com gpu-cluster-policy -w
$ oc get clusterpolicies.nvidia.com gpu-cluster-policy -w
Copy to Clipboard Copied! Toggle word wrap Toggle overflow STATUS
列の準備完了
が表示されるまで待ちます。出力例
NAME STATUS AGE gpu-cluster-policy ready 2025-08-14T08:56:45Z
NAME STATUS AGE gpu-cluster-policy ready 2025-08-14T08:56:45Z
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 次のコマンドを実行して、NVIDIA GPU Operator namespace のすべての Pod が実行されていることを確認します。
oc get pods -n nvidia-gpu-operator
$ oc get pods -n nvidia-gpu-operator
Copy to Clipboard Copied! Toggle word wrap Toggle overflow すべての Pod に
Running
またはCompleted
のステータスが表示されます。以下のコマンドを実行して MIG 対応 GPU でノードにラベルを付け、MIG モードを有効にします。
oc label node $NODE_NAME nvidia.com/mig.config=all-enabled --overwrite
$ oc label node $NODE_NAME nvidia.com/mig.config=all-enabled --overwrite
Copy to Clipboard Copied! Toggle word wrap Toggle overflow $NODE_NAME
を、MIG 対応の GPU を搭載した各ノードの名前に置き換えます。重要MIG ラベルを適用すると、ラベルが付けられたノードが再起動し、MIG モードが有効になります。ノードがオンラインに戻るのを待ってから続行します。
以下のコマンドを実行して、ノードが MIG モードを正常に有効化していることを確認します。
oc get nodes -l nvidia.com/mig.config=all-enabled
$ oc get nodes -l nvidia.com/mig.config=all-enabled
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
DAS Operator の namespace を作成します。
das-operator
namespace を定義する以下のNamespace
カスタムリソース(CR)を作成し、YAML をdas-namespace.yaml
ファイルに保存します。Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下のコマンドを実行して namespace を作成します。
oc create -f das-namespace.yaml
$ oc create -f das-namespace.yaml
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
以下のオブジェクトを作成して、直前の手順で作成した namespace に DAS Operator をインストールします。
以下の
OperatorGroup
CR を作成し、YAML をdas-operatorgroup.yaml
ファイルに保存します。Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下のコマンドを実行して
OperatorGroup
CR を作成します。oc create -f das-operatorgroup.yaml
$ oc create -f das-operatorgroup.yaml
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下の
Subscription
CR を作成し、YAML をdas-sub.yaml
ファイルに保存します。Subscription の例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下のコマンドを実行して Subscription オブジェクトを作成します。
oc create -f das-sub.yaml
$ oc create -f das-sub.yaml
Copy to Clipboard Copied! Toggle word wrap Toggle overflow das-operator
プロジェクトに切り替えます。oc project das-operator
$ oc project das-operator
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下の
DASOperator
CR を作成し、YAML をdas-dasoperator.yaml
ファイルに保存します。DASOperator
CR の例Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 1
DASOperator
CR の名前はcluster
でなければなりません。
次のコマンドを実行して、
dasoperator
CR を作成します。oc create -f das-dasoperator.yaml
oc create -f das-dasoperator.yaml
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
検証
次のコマンドを実行して、Operator のデプロイメントが正常に行われていることを確認します。
oc get pods
$ oc get pods
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 出力例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 正常にデプロイされると、
Running
ステータスを持つすべての Pod が表示されます。デプロイメントには以下が含まれます。- das-operator
- メイン Operator コントローラー Pod
- das-operator-webhook
- 変更用 Pod 要求の Webhook サーバー Pod
- das-scheduler
- MIG スライス割り当て用の Scheduler プラグイン Pod
- Das-daemonset
MIG 互換の GPU を持つノードでのみ実行される DaemonSet Pod
注記das-daemonset
Pod は、MIG 互換の GPU ハードウェアを持つノードにのみ表示されます。daemonset Pod が表示されない場合は、クラスターにサポート対象の GPU ハードウェアを持つノードがあり、NVIDIA GPU Operator が適切に設定されていることを確認します。