第2章 IBM Power および IBM Spyre AI アクセラレーターで使用する検証済みモデル

以下の大規模な言語モデルは、IBM Spyre AI アクセラレーターを備えた IBM Power システムでサポートされています。

注記

IBM Spyre AI アクセラレーターカードは、FP16 形式のモデルの重みのみをサポートします。互換性のあるモデルの場合、Red Hat AI Inference Server 推論エンジンは起動時に自動的に重みを FP16 に変換します。追加の設定は必要ありません。

Expand

表2.1 IBM Spyre AI アクセラレーターで使用する IBM Granite モデル
Model	Hugging Face モデルカード
granite-3.3-8b-instruct	ibm-granite/granite-3.3-8b-instruct
granite-embedding-125m-english	ibm-granite/granite-embedding-125m-english
granite-embedding-278m-multilingual	ibm-granite/granite-embedding-278m-multilingual

重要

事前にビルドされた IBM Granite モデルは、Red Hat AI Inference Server Spyre コンテナーイメージに含まれる特定の Python パッケージで実行されます。モデルは、Spyre カード数、バッチサイズ、および入出力コンテキストサイズの固定設定に関連付けられます。

Red Hat AI Inference Server Spyre コンテナーイメージでの Python パッケージの更新または置き換えはサポートされていません。

第2章 IBM Power および IBM Spyre AI アクセラレーターで使用する検証済みモデル

詳細情報

試用、購入および販売

コミュニティー

会社概要

多様性を受け入れるオープンソースの強化

Red Hat ドキュメントについて

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links