1.2. Granite モデルをサービングする推論のハードウェア要件
次の表は、Red Hat Enterprise Linux AI 上でモデルをサービングする推論の最小ハードウェア要件を示しています。
1.2.1. ベアメタル リンクのコピーリンクがクリップボードにコピーされました!
ハードウェアベンダー | サポートされているアクセラレーター (GPU) | 最小累計 GPU メモリー | 推奨される追加ディスクストレージ |
---|---|---|---|
NVIDIA | A100 | 80 GB | 1 TB |
NVIDIA | H100 | 80 GB | 1 TB |
NVIDIA | H200 | 141 GB | 1 TB |
NVIDIA | GH200 (テクノロジープレビュー) | 192 GB | 1 TP |
NVIDIA | L40S | 48 GB | 1 TB |
NVIDIA | L4 | 24 GB | 1 TB |
AMD | MI300X | 192 GB | 1 TB |
Intel | Gaudi 3 (テクノロジープレビュー) | 128 GB | 1 TB |
1.2.2. Amazon Web Services (AWS) リンクのコピーリンクがクリップボードにコピーされました!
ハードウェアベンダー | サポートされているアクセラレーター (GPU) | 最小累計 GPU メモリー | AWS インスタンスファミリー | 推奨される追加ディスクストレージ |
---|---|---|---|---|
NVIDIA | A100 | 40 GB | P4d シリーズ | 1 TB |
NVIDIA | H100 | 80 GB | P5 シリーズ | 1 TB |
NVIDIA | L40S | 48 GB | G6e シリーズ | 1 TB |
NVIDIA | L4 | 24 GB | G6 シリーズ | 1 TB |
1.2.3. IBM cloud リンクのコピーリンクがクリップボードにコピーされました!
ハードウェアベンダー | サポートされているアクセラレーター (GPU) | 最小累計 GPU メモリー | IBM Cloud インスタンスファミリー | 推奨される追加ディスクストレージ |
---|---|---|---|---|
NVIDIA | L4 | 24 GB | gx3 シリーズ | 1 TB |
NVIDIA | L40S | 48 GB | gx3 シリーズ | 1 TB |
NVIDIA | A100 | 80 GB | gx3 シリーズ | 1 TB |
NVIDIA | H100 | 80 GB | gx3 シリーズ | 1 TB |
NVIDIA | H200 | 141 GB | gx3 シリーズ | 1 TB |
AMD | MI300X | 192 GB | gx3 シリーズ | 1 TB |
Intel | Gaudi 3 (テクノロジープレビュー) | 128 GB | gx3 シリーズ | 1 TB |
1.2.4. Azure リンクのコピーリンクがクリップボードにコピーされました!
ハードウェアベンダー | サポートされているアクセラレーター (GPU) | 最小累計 GPU メモリー | Azure インスタンスファミリー | 推奨される追加ディスクストレージ |
---|---|---|---|---|
NVIDIA | A100 | 80 GB | ND シリーズ | 1 TB |
NVIDIA | H100 | 80 GB | ND シリーズ | 1 TB |
AMD | MI300X | 192 GB | ND シリーズ | 1 TB |
1.2.5. Google Cloud Platform (GCP) リンクのコピーリンクがクリップボードにコピーされました!
ハードウェアベンダー | サポートされているアクセラレーター (GPU) | 最小累計 GPU メモリー | GCP インスタンスファミリー | 推奨される追加ディスクストレージ |
---|---|---|---|---|
NVIDIA | A100 | 40 GB | A2 シリーズ | 1 TB |
NVIDIA | H100 | 80 GB | A3 シリーズ | 1 TB |
NVIDIA | 4xL4 | 96 GB | G2 シリーズ | 1 TB |