第4章 開発者プレビュー機能
このセクションでは、Red Hat OpenShift AI の開発者プレビュー機能を説明します。
開発者プレビュー機能は、Red Hat ではいかなる形でもサポートされていません。また、機能的には完全ではなく、実稼働環境に対応していません。開発者プレビュー機能を実稼働ワークロードまたはビジネスクリティカルなワークロードには使用しないでください。開発者プレビュー機能は、Red Hat 製品に追加される可能性がある機能をいち早く提供することを目的としています。お客様はこの機能を使用してテストし、開発プロセス中にフィードバックを提供できます。開発者プレビュー機能は、ドキュメントが提供されていない場合があり、随時変更または削除される可能性があります。また、限定的なテストしか行われていません。Red Hat は、関連する SLA なしで、開発者プレビュー機能に関するフィードバックを送信する方法を提供する場合があります。
Red Hat 開発者プレビュー機能のサポート範囲の詳細は、開発者プレビューのサポート範囲 を参照してください。
- Llama Stack 開発者プレビュー: OpenShift AI による生成 AI アプリケーションの構築
このリリースでは、OpenShift AI の Llama Stack 開発者プレビュー機能により、次世代の生成 AI アプリケーションを構築するための Retrieval-Augmented Generation (RAG) とエージェントワークフローが可能になります。この機能は、リモート推論、組み込みのエンベディング、ベクトルデータベース操作をサポートしています。また、安全性を担当する TrustyAI のプロバイダーや、評価を担当する Trusty AI の LM-Eval プロバイダーなどのプロバイダーと統合します。
このプレビューには、Llama Stack Operator を有効にし、RAG ツールを操作し、PDF の取り込みとキーワード検索機能を自動化してドキュメントの検出を強化するためのツール、コンポーネント、ガイダンスが含まれています。
- TrustyAI-Llama Stack の安全性とガードレールの評価の実行
開発者プレビュー機能として、組み込みの LM-Eval コンポーネントと高度なコンテンツモデレーションツールを使用しながら、Llama Stack 上で TrustyAI を使用して評価を実行し、ガードレールを適用できるようになりました。この機能を使用するには、TrustyAI が有効になっていること、FMS Orchestrator とディテクターが設定されていること、および必要に応じて完全な互換性を確保するために KServe RawDeployment モードが使用されていることを確認してください。手動でのセットアップは必要ありません。
その後、Red Hat OpenShift AI Operator の
DataScienceCluster
カスタムリソースで、spec.llamastackoperator.managementState
フィールドをManaged
に設定します。詳細は、GitHub の次のリソースを参照してください。
- LLM Compressor の統合
LLM Compressor 機能が、開発者プレビュー機能として Red Hat OpenShift AI で利用できるようになりました。
llm-compressor
ライブラリーを含む新しいワークベンチイメージと対応するデータサイエンスパイプラインランタイムイメージにより、大規模言語モデル (LLM) の圧縮と最適化が容易になり、vLLM を使用した効率的なデプロイメントが可能になります。詳細は、GitHub のllm-compressor
を参照してください。LLM コンプレッサーの機能は次の 2 つの方法で使用できます。
-
Red Hat Quay.io:
opendatahub / llmcompressor-workbench
からのワークベンチイメージ Jupyter ノートブックを使用します。
Jupyter ノートブックの例は、red-hat-ai-examples
リポジトリーのexamples/llmcompressor/workbench_example.ipynb
を参照してください。 -
データサイエンスパイプラインを実行します。このデータサイエンスパイプラインは、Red Hat Quay.io:
opendatahub / llmcompressor-pipeline-runtime
からのランタイムイメージを使用して、モデル圧縮をバッチプロセスとして実行します。
パイプラインの例については、red-hat-ai-examples
リポジトリーのexamples/llmcompressor/oneshot_pipeline.py
を参照してください。
-
Red Hat Quay.io:
- Kueue での AppWrapper のサポート
- Kueue での AppWrapper のサポートは、開発者プレビュー機能として利用できます。実験的な API により、分散ワークロード機能で AppWrapper ベースのワークロードを使用できます。