第3章既知の問題

--enable-chunked-prefill を有効にした Red Hat AI Inference Server 3.1 コンテナーイメージを使用して NVIDIA T4 アクセラレーターにモデルをデプロイすると、チャットまたはテキスト補完クエリーによってモデル推論がクラッシュして再起動します。この問題を回避するには、モデルをデプロイするときに --enable-chunked-prefill フラグを削除します。

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。最新の更新を見る.

トップに戻る

第3章 既知の問題