第1章 OpenShift Container Platform 上の AI ワークロードの概要
OpenShift Container Platform は、トレーニング、推論、データサイエンスのワークフロー全体にわたり、人工知能 (AI) ワークロードを実行するためのセキュアでスケーラブルな基盤を提供します。
1.1. AI ワークロードを実行するための Operator リンクのコピーリンクがクリップボードにコピーされました!
OpenShift Container Platform では、Operator を使用して人工知能 (AI) および機械学習 (ML) のワークロードを実行できます。Operator を使用すると、OpenShift Container Platform をアプリケーションのコアプラットフォームとして引き続き使用しながら、特定の AI/ML 要件に合わせてカスタマイズした環境を構築できます。
OpenShift Container Platform には、AI ワークロードの実行に役立つ Operator がいくつかあります。
- Red Hat build of Kueue
Red Hat build of Kueue を使用すると、構造化されたキューと優先順位付けにより、ワークロードを公平かつ効率的に処理できます。適切な優先順位付けを行わないと、重要度の低いジョブがリソースを占有し、重要なジョブが遅延する可能性があります。
詳細は、「Red Hat build of Kueue の概要」を参照してください。
- Leader Worker Set Operator
Leader Worker Set Operator を使用すると、リーダープロセスとワーカープロセス間の同期により、大規模な AI 推論ワークロードを複数のノードにまたがって安定して実行できるようになります。適切な連携がなければ、大規模なトレーニングの実行が失敗したり停止したりする可能性があります。
詳細は、「Leader Worker Set Operator の概要」を参照してください。