第2章 IBM Power および IBM Spyre AI アクセラレーターで使用する検証済みモデル
以下の大規模な言語モデルは、IBM Spyre AI アクセラレーターを備えた IBM Power システムでサポートされています。
IBM Spyre AI アクセラレーターカードは、FP16 形式のモデルの重みのみをサポートします。互換性のあるモデルの場合、Red Hat AI Inference Server 推論エンジンは起動時に自動的に重みを FP16 に変換します。追加の設定は必要ありません。
| Model | Hugging Face モデルカード |
|---|---|
| granite-3.3-8b-instruct | |
| granite-embedding-125m-english | |
| granite-embedding-278m-multilingual |
事前にビルドされた IBM Granite モデルは、Red Hat AI Inference Server Spyre コンテナーイメージに含まれる特定の Python パッケージで実行されます。モデルは、Spyre カード数、バッチサイズ、および入出力コンテキストサイズの固定設定に関連付けられます。
Red Hat AI Inference Server Spyre コンテナーイメージでの Python パッケージの更新または置き換えはサポートされていません。