7.6. ワークベンチ Pod toleration の追加
特定のマシンプールをワークベンチ Pod の実行専用にする場合は、toleration を追加して、ワークベンチ Pod を特定のノードでスケジュールできます。taint と toleration を使用して、ノードはどの Pod をスケジュールするか (またはスケジュールしないか) を制御できます。詳細は、taint と toleration の範囲について を参照してください。
この機能は、ワークベンチがそのニーズに対応できるノードに配置されていることを確認する場合に役立ちます。これらの特定のノードで他のワークロードが実行されないようにして、大規模なワークベンチサイズで作業する必要があるユーザーが必要なリソースを利用できるようになります。
前提条件
- OpenShift AI 管理者権限を持つユーザーとして OpenShift AI にログインしている。
- taint と toleration について で説明されているように、OpenShift の taint と toleration を理解している。
手順
-
OpenShift AI ダッシュボードから、Settings
Cluster settings をクリックします。 - Workbench pod tolerations で、Add a toleration to workbench pods to allow them to be scheduled to tainted nodes を選択します。
-
Toleration key for workbench pods フィールドに、toleration キーを入力します。キーは、最大 253 文字までの任意の文字列になります。キーは文字または数字で始まる必要があり、文字、数字、ハイフン、ドット、アンダースコアを含めることができます。たとえば、
workbenches-only
です。 Save changes をクリックします。toleration キーは、新しいワークベンチ Pod が作成されるときに適用されます。
既存のワークベンチ Pod の場合、ワークベンチ Pod が再起動されると、toleration キーが適用されます。
基本ワークベンチを使用している場合は、ワークベンチを再起動してワークベンチ設定を更新するを 参照してください。データサイエンスプロジェクトでワークベンチを使用している場合は、ワークベンチの開始を 参照してください。
次のステップ
OpenShift では、ワークベンチ専用として指定するマシンプールと同じ taint キー (任意の値) を追加します。詳細は、ノード taint を使用した Pod の配置の制御 を参照してください。
詳細は、マシンプールへの taint の追加 を参照してください。
検証
-
OpenShift コンソールで、データサイエンスプロジェクトを選択し、Workloads
StatefulSet をクリックします。現在、ワークベンチが起動しているか、停止しているかで、実行中の Pod の数 (0 個または 1 個) を確認できます。 - ワークベンチ Pod 名を検索し、名前をクリックして Pod の詳細ページを開きます。
- 割り当てられた Node と Tolerations が正しいことを確認します。