8.4. Red Hat build of Kueue Operator への移行
分散ワークロードを管理するための組み込み Kueue コンポーネントは非推奨になりました。Red Hat build of Kueue Operator に移行する必要があります。組み込み Kueue および Red Hat build of Kueue Operator の両方を同じクラスターにインストールできません。同じリソースを管理するコントローラーが作成され、競合してしまうためです。
OpenShift AI は、既存のワークロードを Red Hat build of Kueue に自動的に移行しません。クラスター管理者は、アップグレード後もワークロードがキュー管理を引き続き使用できるように、組み込み Kueue から Red Hat build of Kueue Operator に手動で移行する必要があります。
前提条件
- OpenShift クラスターのクラスター管理者権限を持っている。
- OpenShift 4.18 以降を使用している。
- クラスター用に Red Hat OpenShift の cert-manager Operator をインストールして設定している。
-
埋め込まれた Kueue コンポーネントが有効になっています (つまり、
DataScienceClusterオブジェクトのspec.components.kueue.managementStateフィールドがManagedに設定されています)。
手順
オプション: 組み込み Kueue から Red Hat build of Kueue に移行すると、OpenShift AI Operator は既存の Kueue 設定を
kueue-manager-configConfigMap からKueueカスタムリソース (CR) に自動的に移動します。kueue-manager-configConfigMap を保持するには、次のコマンドを実行します。<applications-namespace>は、OpenShift AI アプリケーションの namespace に置き換えます。デフォルトはredhat-ods-applicationsです。oc annotate configmap kueue-manager-config -n <applications-namespace> opendatahub.io/managed=false
$ oc annotate configmap kueue-manager-config -n <applications-namespace> opendatahub.io/managed=falseCopy to Clipboard Copied! Toggle word wrap Toggle overflow - OpenShift Web コンソールにクラスター管理者としてログインします。
オプション (推奨): 潜在的な設定の競合を避けるため、Red Hat build of Kueue をインストールする前に、組み込みの Kueue コンポーネントをアンインストールします。
-
Web コンソールで、Operators
Installed Operators をクリックし、Red Hat OpenShift AI Operator をクリックします。 - Data Science Cluster タブをクリックします。
- default-dsc オブジェクトをクリックします。
- YAML タブをクリックします。
次のように、
spec.components.kueue.managementStateをRemovedに設定します。spec: components: kueue: managementState: Removedspec: components: kueue: managementState: RemovedCopy to Clipboard Copied! Toggle word wrap Toggle overflow - Save をクリックします。
OpenShift AI Operator が調整するまで待機し、埋め込まれた Kueue が削除されたことを確認します。
-
default-dscオブジェクトの Details タブで、KueueReady 条件の Status がFalseで、Reason がRemovedになっていることを確認します。 -
Workloads
Deployments に移動し、OpenShift AI がインストールされているプロジェクト (例: redhat-ods-applications) を選択し、Kueue 関連のデプロイメント (例:kueue-controller-manager) が存在しなくなっていることを確認します。
-
-
Web コンソールで、Operators
OpenShift クラスターに Red Hat build of Kueue Operator をインストールします。
- Red Hat build of Kueue ドキュメント に記載された Red Hat build of Kueue Operator のインストール手順を実行します。
-
Operators
Installed Operators に移動し、Red Hat build of Kueue Operator の Status が Succeeded と表示されていることを確認します。
OpenShift AI で Red Hat build of Kueue Operator をアクティブ化します。
-
Web コンソールで、Operators
Installed Operators をクリックし、Red Hat OpenShift AI Operator をクリックします。 - Data Science Cluster タブをクリックします。
- default-dsc オブジェクトをクリックします。
- YAML タブをクリックします。
spec.components.kueue.managementStateをUnmanagedに設定します。デフォルトのクラスターキューとデフォルトのローカルキューには、定義済みの名前 (default) を使用するか、次の例に示すようにカスタム名を指定できます。定義済みのキュー名を使用するには、次の設定を適用します。
spec: components: kueue: managementState: Unmanagedspec: components: kueue: managementState: UnmanagedCopy to Clipboard Copied! Toggle word wrap Toggle overflow カスタムキュー名を指定するには、
<example-cluster-queue>と<example-local-queue>をカスタム値に置き換えて、次の設定を適用します。Copy to Clipboard Copied! Toggle word wrap Toggle overflow
- Save をクリックします。
-
Web コンソールで、Operators
各プロジェクト namespace に
kueue.openshift.io/managed=trueラベルを適用して、既存のプロジェクトの Kueue 管理を有効にします。oc label namespace <project-namespace> kueue.openshift.io/managed=true --overwrite
$ oc label namespace <project-namespace> kueue.openshift.io/managed=true --overwriteCopy to Clipboard Copied! Toggle word wrap Toggle overflow <project-namespace>はプロジェクトの名前に置き換えます。注記Kueue の検証とキューの適用は、
kueue.openshift.io/managed=trueラベルが指定された namespace 内のワークロードのみが対象です。
検証
- 埋め込まれた Kueue が削除されていることを確認します。
-
DataScienceClusterリソースで、Kueue の正常なUnmanagedステータスが表示されていることを確認します。 - キュー内の既存のワークロードが、新しいオペレータ管理 Kueue コントローラーによって引き続き処理されることを確認します。機能を確認するには、新しいテストワークロードを送信します。
次のステップ
-
ResourceFlavor、ClusterQueue、およびLocalQueueオブジェクトを作成および変更して、クォータを設定します。詳細は、Red Hat build of Kueue ドキュメント を参照してください。 - ダッシュボードで Kueue を有効にして、ユーザーがワークロードを作成するときに Kueue 対応のオプションを選択できるようにします。Kueue を有効にすると、ダッシュボードから作成されたすべての新しいプロジェクトに対して Kueue 管理も有効になります。ダッシュボードで Kueue を有効にする を参照してください。
- クラスター管理者と OpenShift AI 管理者は、ユーザーが OpenShift AI ダッシュボードからワークロードを送信できるように、ハードウェアプロファイルを作成できます。ハードウェアプロファイルの使用 を参照してください。