第2章 新機能および機能拡張
このセクションでは、Red Hat OpenShift AI の新機能と機能拡張について説明します。
2.1. 新機能 リンクのコピーリンクがクリップボードにコピーされました!
- TrustyAI に KServe InferenceLogger 統合のサポートが追加される
TrustyAI は、InferenceLogger 自動設定を通じて KServe 推論のデプロイメントをサポートするようになりました。
KServe Raw と Serverless の両方がサポートされており、デプロイメントモードは
InferenceService
アノテーションを使用して自動的に検出されます。
- Kueue によるワークロードスケジューリングの強化
OpenShift AI は Red Hat build of Kueue により、ワークロードスケジューリング機能が強化されました。Kueue は、ワークロードのリソースを考慮したスケジューリングを提供し、GPU 使用率を向上させ、AI ワークロード全体でインテリジェントなクォータベースのスケジューリングによって、リソース共有の公平性を確保するジョブキューイングシステムです。
この機能により、OpenShift AI での Kueue のワークロードサポートが拡張され、これまでサポートされていた分散トレーニングジョブ (
RayJob
、RayCluster
、PyTorchJob
) に加えて、ワークベンチ (Notebook
) とモデルサービング (InferenceService
) が含まれるようになります。検証 webhook がキュー (ポリシー) の適用を処理するようになりました。この webhook により、Kueue 管理が有効になっているプロジェクト (
kueue.openshift.io/managed=true
ラベル付き) では、サポートされているすべてのワークロードでターゲットのLocalQueue
(kueue.x-k8s.io/queue-name
ラベル付き) を指定する必要があります。これは、以前のバージョンで使用されていた Validating Admission Policy に代わるものです。詳細は、Kueue を使用したワークロードの管理 を参照してください。
- イメージ内の git commit ハッシュを表示するためのサポートが追加される
- git commit ハッシュをイメージで表示できるようになりました。この機能を使用すると、バージョン番号が同じであっても、イメージが変更されたかどうかを判断できます。必要に応じて、イメージをソースコードまで追跡できます。
- Elyra によるデータサイエンスパイプラインのサポートが追加される
- Elyra でデータサイエンスパイプラインを使用する場合、ルートベースの URL ではなくサービスベースの URL を使用するオプションが追加されました。ポート番号を含めることで、データサイエンスパイプラインをサービスから直接使用できるようになります。
- ワークベンチイメージはデフォルトでミラーリングされる
イメージをプライベートレジストリーにミラーリングして非接続インストールを行う場合に、ワークベンチイメージの最新バージョンがデフォルトでミラーリングされます。管理者は、Disconnected Helper 設定の
additionalImages
フィールドを通じて、ワークベンチイメージの古いバージョンをミラーリングできます。重要バグ修正とセキュリティー更新が適用された最新バージョンのワークベンチイメージのみがサポートされます。古いバージョンのワークベンチイメージも利用可能ですが、バグ修正やセキュリティー更新は受けられません。