1.2. 对 inference 服务 Granite 模型的硬件要求


下图显示了在 Red Hat Enterprise Linux AI 上提供模型的最低硬件要求。

1.2.1. 裸机

Expand
硬件供应商支持的加速器(GPU)最小 Aggregate GPU 内存推荐的附加磁盘存储

NVIDIA

A100

80 GB

1 TB

NVIDIA

H100

80 GB

1 TB

NVIDIA

H200

141 GB

1 TB

NVIDIA

GH200 (技术预览)

192 GB

1 TP

NVIDIA

L40S

48 GB

1 TB

NVIDIA

L4

24 GB

1 TB

AMD

MI300X

192 GB

1 TB

Intel

Gaudi 3 (技术预览)

128 GB

1 TB

1.2.2. Amazon Web Services (AWS)

Expand
硬件供应商支持的加速器(GPU)最小 Aggregate GPU 内存AWS 实例系列推荐的附加磁盘存储

NVIDIA

A100

40 GB

P4d 系列

1 TB

NVIDIA

H100

80 GB

P5 系列

1 TB

NVIDIA

L40S

48 GB

G6e 系列

1 TB

NVIDIA

L4

24 GB

G6 系列

1 TB

1.2.3. IBM cloud

Expand
硬件供应商支持的加速器(GPU)最小 Aggregate GPU 内存IBM Cloud Instance 系列推荐的附加磁盘存储

NVIDIA

L4

24 GB

gx3 series

1 TB

NVIDIA

L40S

48 GB

gx3 series

1 TB

NVIDIA

A100

80 GB

gx3 series

1 TB

NVIDIA

H100

80 GB

gx3 series

1 TB

NVIDIA

H200

141 GB

gx3 series

1 TB

AMD

MI300X

192 GB

gx3 series

1 TB

Intel

Gaudi 3 (技术预览)

128 GB

gx3 series

1 TB

1.2.4. Azure

Expand
硬件供应商支持的加速器(GPU)最小 Aggregate GPU 内存Azure Instance 系列推荐的附加磁盘存储

NVIDIA

A100

80 GB

ND 系列

1 TB

NVIDIA

H100

80 GB

ND sereis

1 TB

AMD

MI300X

192 GB

ND 系列

1 TB

1.2.5. Google Cloud Platform (GCP)

Expand
硬件供应商支持的加速器(GPU)最小 Aggregate GPU 内存GCP 实例系列推荐的附加磁盘存储

NVIDIA

A100

40 GB

A2 系列

1 TB

NVIDIA

H100

80 GB

A3 系列

1 TB

NVIDIA

4xL4

96 GB

G2 系列

1 TB

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat