1.2. 对 inference 服务 Granite 模型的硬件要求
下图显示了在 Red Hat Enterprise Linux AI 上提供模型的最低硬件要求。
1.2.1. 裸机 复制链接链接已复制到粘贴板!
硬件供应商 | 支持的加速器(GPU) | 最小 Aggregate GPU 内存 | 推荐的附加磁盘存储 |
---|---|---|---|
NVIDIA | A100 | 80 GB | 1 TB |
NVIDIA | H100 | 80 GB | 1 TB |
NVIDIA | H200 | 141 GB | 1 TB |
NVIDIA | GH200 (技术预览) | 192 GB | 1 TP |
NVIDIA | L40S | 48 GB | 1 TB |
NVIDIA | L4 | 24 GB | 1 TB |
AMD | MI300X | 192 GB | 1 TB |
Intel | Gaudi 3 (技术预览) | 128 GB | 1 TB |
1.2.2. Amazon Web Services (AWS) 复制链接链接已复制到粘贴板!
硬件供应商 | 支持的加速器(GPU) | 最小 Aggregate GPU 内存 | AWS 实例系列 | 推荐的附加磁盘存储 |
---|---|---|---|---|
NVIDIA | A100 | 40 GB | P4d 系列 | 1 TB |
NVIDIA | H100 | 80 GB | P5 系列 | 1 TB |
NVIDIA | L40S | 48 GB | G6e 系列 | 1 TB |
NVIDIA | L4 | 24 GB | G6 系列 | 1 TB |
1.2.3. IBM cloud 复制链接链接已复制到粘贴板!
硬件供应商 | 支持的加速器(GPU) | 最小 Aggregate GPU 内存 | IBM Cloud Instance 系列 | 推荐的附加磁盘存储 |
---|---|---|---|---|
NVIDIA | L4 | 24 GB | gx3 series | 1 TB |
NVIDIA | L40S | 48 GB | gx3 series | 1 TB |
NVIDIA | A100 | 80 GB | gx3 series | 1 TB |
NVIDIA | H100 | 80 GB | gx3 series | 1 TB |
NVIDIA | H200 | 141 GB | gx3 series | 1 TB |
AMD | MI300X | 192 GB | gx3 series | 1 TB |
Intel | Gaudi 3 (技术预览) | 128 GB | gx3 series | 1 TB |
1.2.4. Azure 复制链接链接已复制到粘贴板!
硬件供应商 | 支持的加速器(GPU) | 最小 Aggregate GPU 内存 | Azure Instance 系列 | 推荐的附加磁盘存储 |
---|---|---|---|---|
NVIDIA | A100 | 80 GB | ND 系列 | 1 TB |
NVIDIA | H100 | 80 GB | ND sereis | 1 TB |
AMD | MI300X | 192 GB | ND 系列 | 1 TB |
1.2.5. Google Cloud Platform (GCP) 复制链接链接已复制到粘贴板!
硬件供应商 | 支持的加速器(GPU) | 最小 Aggregate GPU 内存 | GCP 实例系列 | 推荐的附加磁盘存储 |
---|---|---|---|---|
NVIDIA | A100 | 40 GB | A2 系列 | 1 TB |
NVIDIA | H100 | 80 GB | A3 系列 | 1 TB |
NVIDIA | 4xL4 | 96 GB | G2 系列 | 1 TB |