第6章 Dynamic Accelerator Slicer (DAS) Operator
Dynamic Accelerator Slicer Operator は、テクノロジープレビュー機能です。テクノロジープレビュー機能は、Red Hat 製品のサービスレベルアグリーメント (SLA) の対象外であり、機能的に完全ではないことがあります。Red Hat は、実稼働環境でこれらを使用することを推奨していません。テクノロジープレビュー機能は、最新の製品機能をいち早く提供して、開発段階で機能のテストを行い、フィードバックを提供していただくことを目的としています。
Red Hat のテクノロジープレビュー機能のサポート範囲に関する詳細は、テクノロジープレビュー機能のサポート範囲 を参照してください。
Dynamic Accelerator Slicer (DAS) Operator を使用すると、ノードのブート時に定義される静的にスライスされた GPU に依存するのではなく、OpenShift Container Platform で GPU アクセラレーターを動的にスライスできます。これにより、特定のワークロードの需要に基づき GPU を動的にスライスし、効率的なリソース利用を実現できます。
動的スライスは、クラスター上のすべてのノードで必要なアクセラレーターパーティションすべてを事前に把握できない場合に便利です。
現在、DAS Operator には NVIDIA マルチインスタンス GPU (MIG) のリファレンス実装が含まれており、将来的には NVIDIA MPS や他のベンダーの GPU などの追加テクノロジーもサポートできるように設計されています。
制限事項
Dynamic Accelerator Slicer Operator を使用する場合、次の制限が適用されます。
- 潜在的な非互換性を特定し、システムがさまざまな GPU ドライバーおよびオペレーティングシステムでシームレスに動作することを確認する必要があります。
- Operator は、H100 や A100 など、特定の MIG 互換 NVIDIA GPU およびドライバーでのみ動作します。
- Operator はノードの GPU のサブセットのみを使用することはできません。
- NVIDIA デバイスプラグインを Dynamic Accelerator Slicer Operator と組み合わせて使用して、クラスターの GPU リソースを管理することはできません。
DAS Operator は、MIG 対応 GPU で動作するように設計されています。GPU 全体ではなく、MIG スライスを割り当てます。DAS Operator をインストールすると、GPU 全体を割り当てる nvidia.com/gpu: "1"
などの NVIDIA デバイスプラグインを介した標準リソース要求の使用が防止されます。
6.1. Dynamic Accelerator Slicer Operator のインストール リンクのコピーリンクがクリップボードにコピーされました!
クラスター管理者は、OpenShift Container Platform Web コンソールまたは OpenShift CLI を使用して、Dynamic Accelerator Slicer (DAS) Operator をインストールできます。
6.1.1. Web コンソールを使用して Dynamic Accelerator Slicer Operator をインストールする リンクのコピーリンクがクリップボードにコピーされました!
クラスター管理者は、OpenShift Container Platform Web コンソールを使用して Dynamic Accelerator Slicer (DAS) Operator をインストールできます。
前提条件
-
cluster-admin
パーミッションを持つアカウントを使用して OpenShift Container Platform クラスターにアクセスできる。 必要な前提条件として下記をインストールした。
- cert-manager Operator for Red Hat OpenShift
- Node Feature Discovery (NFD) Operator
- NVIDIA GPU Operator
- NodeFeatureDiscovery CR
手順
MIG サポート用に NVIDIA GPU Operator を設定します。
-
OpenShift Container Platform Web コンソールで、Operators
Installed Operators に移動します。 - インストール済み Operator のリストから NVIDIA GPU Operator を選択します。
- ClusterPolicy タブをクリックし、Create ClusterPolicy をクリックします。
YAML エディターで、デフォルトのコンテンツを次のクラスターポリシー設定に置き換えてデフォルトの NVIDIA デバイスプラグインを無効にし、MIG サポートを有効にします。
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - Create をクリックしてクラスターポリシーを適用します。
-
Workloads
Pods に移動し、 nvidia-gpu-operator
namespace を選択して、クラスターポリシーのデプロイメントを監視します。 NVIDIA GPU Operator クラスターポリシーが
Ready
状態になるまで待ちます。次の方法で監視できます。-
Operators
Installed Operators NVIDIA GPU Operator に移動します。 -
ClusterPolicy タブをクリックし、ステータスが
ready
になっていることを確認します。
-
Operators
-
nvidia-gpu-operator
namespace を選択し、WorkloadsPods に移動して、NVIDIA GPU Operator namespace 内のすべての Pod が実行されていることを確認します。 MIG 対応 GPU のノードにラベルを付けて MIG モードを有効にします。
-
Compute
Nodes に移動します。 - MIG 対応 GPU を搭載したノードを選択します。
-
Actions
Edit Labels をクリックします。 -
nvidia.com/mig.config=all-enabled
ラベルを追加します。 - Save をクリックします。
MIG 対応 GPU を搭載した各ノードに対して繰り返します。
重要MIG ラベルを適用すると、ラベルが付いたノードはリブートし、MIG モードが有効になります。ノードがオンラインに戻るまで待機してから続行します。
-
Compute
-
Labels セクションに
nvidia.com/mig.config=all-enabled
ラベルが表示されていることを確認し、GPU ノードで MIG モードが正常に有効化されていることを確認します。ラベルを見つけるには、ComputeNodes に移動し、GPU ノードを選択して、Details タブをクリックします。
-
OpenShift Container Platform Web コンソールで、Operators
-
OpenShift Container Platform Web コンソールで、Operators
OperatorHub をクリックします。 - DAS Operator を見つけるには、フィルターボックスで Dynamic Accelerator Slicer または DAS を検索します。
- Dynamic Accelerator Slicer を選択し、Install をクリックします。
Install Operator ページで以下を行います。
- インストールモードとして All namespaces on the cluster (default) を選択します。
-
Installed Namespace
Operator recommended Namespace: Project das-operator を選択します。 -
新しい namespace を作成する場合は、namespace の名前として
das-operator
を入力します。 - 更新チャネルを選択します。
- 承認ストラテジーとして Automatic または Manual を選択します。
- Install をクリックします。
-
OpenShift Container Platform Web コンソールで、Operators
Installed Operators をクリックします。 - リストから DAS Operator を選択します。
- Provided APIs テーブル列で、DASOperator をクリックします。この操作により、Operator details ページの DASOperator タブに移動します。
- Create DASOperator をクリックします。この操作により、Create DASOperator YAML ビューになります。
YAML エディターで次の例を貼り付けます。
DASOperator
CR の例Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 1
DASOperator
CR の名前はcluster
でなければなりません。
- Create をクリックします。
検証
DAS Operator が正常にインストールされたことを確認するには、以下を実行します。
-
Operators
Installed Operators ページに移動します。 -
Dynamic Accelerator Slicer が、
das-Operator
namespace にリストされ、Status が Succeeded になっていることを確認します。
DASOperator
CR が正常にインストールされたことを確認するには、以下を実行します。
-
DASOperator
CR を作成すると、Web コンソールに DASOperator list view が表示されます。すべてのコンポーネントが実行中になると、CR の Status フィールドは Available に変わります。 オプション: OpenShift CLI で次のコマンドを実行すると、
DASOperator
CR が正常にインストールされたことを確認できます。oc get dasoperator -n das-operator
$ oc get dasoperator -n das-operator
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 出力例
NAME STATUS AGE cluster Available 3m
NAME STATUS AGE cluster Available 3m
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
インストール時に、Operator は Failed ステータスを表示する可能性があります。その後インストールが成功し、Succeeded メッセージが表示された場合は、Failed メッセージを無視できます。
Pod をチェックしてインストールを確認することもできます。
-
Workloads
Pods ページに移動し、 das-operator
namespace を選択します。 すべての DAS Operator コンポーネント Pod が実行中であることを確認します。
-
das-operator
Pod (メイン Operator コントローラー) -
das-operator-webhook
Pod (Webhook サーバー) -
das-scheduler
Pod (スケジューラープラグイン) -
das-daemonset
Pod (MIG 互換 GPU を搭載したノードのみ)
-
das-daemonset
Pod は、MIG 互換 GPU ハードウェアを持つノードにのみ表示されます。daemonset Pod が表示されない場合は、クラスターにサポート対象の GPU ハードウェアを持つノードがあり、NVIDIA GPU Operator が適切に設定されていることを確認してください。
トラブルシューティング
Operator がインストールされていないようであれば、次の手順を実行します。
-
Operators
Installed Operators ページに移動し、Operator Subscriptions および Install Plans タブで Status にエラーがあるかどうかを検査します。 -
Workloads
Pods ページに移動し、 das-operator
namespace 内の Pod のログを確認します。
6.1.2. CLI を使用して Dynamic Accelerator Slicer Operator をインストールする リンクのコピーリンクがクリップボードにコピーされました!
クラスター管理者は、OpenShift CLI を使用して Dynamic Accelerator Slicer (DAS) Operator をインストールできます。
前提条件
-
cluster-admin
パーミッションを持つアカウントを使用して OpenShift Container Platform クラスターにアクセスできる。 -
OpenShift CLI (
oc
) がインストールされている。 必要な前提条件として下記をインストールした。
- cert-manager Operator for Red Hat OpenShift
- Node Feature Discovery (NFD) Operator
- NVIDIA GPU Operator
- NodeFeatureDiscovery CR
手順
MIG サポート用に NVIDIA GPU Operator を設定します。
次のクラスターポリシーを適用して、デフォルトの NVIDIA デバイスプラグインを無効にし、MIG サポートを有効にします。次の内容で、
gpu-cluster-policy.yaml
という名前のファイルを作成します。Copy to Clipboard Copied! Toggle word wrap Toggle overflow 次のコマンドを実行してクラスターポリシーを適用します。
oc apply -f gpu-cluster-policy.yaml
$ oc apply -f gpu-cluster-policy.yaml
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 次のコマンドを実行して、NVIDIA GPU Operator クラスターポリシーの状態が
Ready
になることを確認します。oc get clusterpolicies.nvidia.com gpu-cluster-policy -w
$ oc get clusterpolicies.nvidia.com gpu-cluster-policy -w
Copy to Clipboard Copied! Toggle word wrap Toggle overflow STATUS
列にready
と表示されるまで待ちます。出力例
NAME STATUS AGE gpu-cluster-policy ready 2025-08-14T08:56:45Z
NAME STATUS AGE gpu-cluster-policy ready 2025-08-14T08:56:45Z
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 次のコマンドを実行して、NVIDIA GPU Operator namespace 内のすべての Pod が実行されていることを確認します。
oc get pods -n nvidia-gpu-operator
$ oc get pods -n nvidia-gpu-operator
Copy to Clipboard Copied! Toggle word wrap Toggle overflow すべての Pod のステータスが
Running
またはRunning
と表示されるはずです。次のコマンドを実行し、MIG 対応 GPU を搭載したノードにラベルを付けて MIG モードを有効にします。
oc label node $NODE_NAME nvidia.com/mig.config=all-enabled --overwrite
$ oc label node $NODE_NAME nvidia.com/mig.config=all-enabled --overwrite
Copy to Clipboard Copied! Toggle word wrap Toggle overflow $NODE_NAME
は、MIG 対応 GPU を持つ各ノードの名前に置き換えます。重要MIG ラベルを適用した後、ラベルの付いたノードがリブートされ、MIG モードが有効になります。ノードがオンラインに戻るまで待機してから続行します。
次のコマンドを実行して、ノードで MIG モードが正常に有効化されていることを確認します。
oc get nodes -l nvidia.com/mig.config=all-enabled
$ oc get nodes -l nvidia.com/mig.config=all-enabled
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
DAS Operator の namespace を作成します。
das-operator
namespace を定義する次のNamespace
カスタムリソース (CR) を作成し、YAML をdas-namespace.yaml
ファイルに保存します。Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下のコマンドを実行して namespace を作成します。
oc create -f das-namespace.yaml
$ oc create -f das-namespace.yaml
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
以下のオブジェクトを作成して、直前の手順で作成した namespace に DAS Operator をインストールします。
以下の
OperatorGroup
CR を作成し、YAML をdas-operatorgroup.yaml
ファイルに保存します。Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下のコマンドを実行して
OperatorGroup
CR を作成します。oc create -f das-operatorgroup.yaml
$ oc create -f das-operatorgroup.yaml
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下の
Subscription
CR を作成し、YAML をdas-sub.yaml
ファイルに保存します。Subscription の例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下のコマンドを実行して Subscription オブジェクトを作成します。
oc create -f das-sub.yaml
$ oc create -f das-sub.yaml
Copy to Clipboard Copied! Toggle word wrap Toggle overflow das-operator
プロジェクトに変更します。oc project das-operator
$ oc project das-operator
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 次の
DASOperator
CR を作成し、YAML をdas-dasoperator.yaml
ファイルに保存します。DASOperator
CR の例Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 1
DASOperator
CR の名前はcluster
でなければなりません。
次のコマンドを実行して、
dasoperator
CR を作成します。oc create -f das-dasoperator.yaml
oc create -f das-dasoperator.yaml
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
検証
次のコマンドを実行して、Operator のデプロイメントが成功したことを確認します。
oc get pods
$ oc get pods
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 出力例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow デプロイメントが成功すると、すべての Pod のステータスが
Running
になります。デプロイメントには以下が含まれます。- das-operator
- メイン Operator コントローラー Pod
- das-operator-webhook
- Pod 要求を変更するための Webhook サーバー Pod
- das-scheduler
- MIG スライスを割り当てるためのスケジューラープラグイン Pod
- das-daemonset
MIG 互換 GPU を搭載したノード上でのみ稼働する daemonset Pod
注記das-daemonset
Pod は、MIG 互換 GPU ハードウェアを持つノードにのみ表示されます。daemonset Pod が表示されない場合は、クラスターにサポート対象の GPU ハードウェアを持つノードがあり、NVIDIA GPU Operator が適切に設定されていることを確認してください。