第3章 IBM Z および IBM Spyre AI アクセラレーターで使用する検証済みモデル


以下の大規模な言語モデルは、IBM Spyre AI アクセラレーターを備えた IBM Z システムでサポートされています。

注記

IBM Spyre AI アクセラレーターカードは、FP16 形式のモデルの重みのみをサポートします。互換性のあるモデルの場合、Red Hat AI Inference Server 推論エンジンは起動時に自動的に重みを FP16 に変換します。追加の設定は必要ありません。

Expand
表3.1 IBM Spyre AI アクセラレーターと使用するデコーダーモデル
ModelHugging Face モデルカード

granite-3.3-8b-instruct

ibm-granite/granite-3.3-8b-instruct

重要

事前にビルドされた IBM Granite モデルは、Red Hat AI Inference Server Spyre コンテナーイメージに含まれる特定の Python パッケージで実行されます。モデルは、Spyre カード数、バッチサイズ、および入出力コンテキストサイズの固定設定に関連付けられます。

Red Hat AI Inference Server Spyre コンテナーイメージでの Python パッケージの更新または置き換えはサポートされていません。

Red Hat logoGithubredditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。 最新の更新を見る.

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

Theme

© 2026 Red Hat
トップに戻る