支持的产品和硬件配置


Red Hat AI Inference Server 3.0

用于部署 Red Hat AI Inference Server 支持的硬件和软件配置

Red Hat AI Documentation Team

摘要

了解 Red Hat AI Inference Server 支持的硬件和软件配置。

前言

本文档描述了可用于在生产环境中运行 Red Hat AI Inference Server 支持的硬件、软件和交付平台。

重要

提供了 技术预览功能开发人员预览功能,供早期访问潜在的新功能。

对于生产环境工作负载,不支持或开发者技术预览功能。

第 1 章 产品和版本兼容性

下表列出了 Red Hat AI Inference Server 3.0 支持的产品版本。

表 1.1. 产品和版本兼容性
产品支持的版本

Red Hat AI Inference Server

3.0

vLLM core

0.8.4

LLM Compressor

0.5.1 技术预览

第 2 章 支持的 AI 加速器

下表列出了 Red Hat AI Inference Server 3.0 支持的 AI 加速器。

表 2.1. 支持 NVIDIA AI 加速器
容器镜像vLLM releaseAI 加速器要求vLLM 架构支持LLM Compressor 支持

rhaiis/vllm‑cuda-rhel9

vLLM 0.8.4

  • Turing
  • Ampere
  • ada
  • Hopper
  • x86
  • Aarch64 开发人员预览

x86 技术预览

表 2.2. 支持的 AMD AI 加速器
容器镜像vLLM releaseAI 加速器要求vLLM 架构支持LLM Compressor 支持

rhaiis/vllm‑rocm-rhel9

vLLM 0.8.4

  • AMD Instinct MI210
  • AMD Instinct MI300X

x86

x86 技术预览

表 2.3. 支持 Google TPU AI 加速器
容器镜像vLLM releaseAI 加速器要求vLLM 架构支持LLM Compressor 支持

rhaiis/vllm‑xla-rhel9

vLLM 0.8.5

Google TPU v6e

PyTorch/XLA 2.8.0

x86 开发人员预览

不支持

第 3 章 支持的部署环境

支持以下 Red Hat AI Inference Server 的部署环境。

表 3.1. Red Hat AI Inference Server 支持的部署环境
环境支持的版本部署备注

OpenShift Container Platform (自助管理的)

4.14 – 4.18

在裸机主机或虚拟机上部署。

Red Hat OpenShift Service on AWS (ROSA)

4.14 – 4.18

需要启用了 GPU 的 P5 或 G5 节点类型的 ROSA STS 集群

Red Hat Enterprise Linux (RHEL)

9.2 – 10.0

在裸机主机或虚拟机上部署。

Linux (not RHEL)

-

在裸机主机或虚拟机上部署的第三方策略下支持。OpenShift Container Platform Operator 不需要。

Kubernetes (而不是 OpenShift Container Platform)

-

在裸机主机或虚拟机上部署的第三方策略下支持。

注意

Red Hat AI Inference Server 仅作为容器镜像提供。主机操作系统和内核必须支持所需的加速器驱动程序。如需更多信息,请参阅支持的 AI Accelerators

第 4 章 GPU 部署的 OpenShift Container Platform 软件先决条件

下表列出了 GPU 部署的 OpenShift Container Platform 软件先决条件。

表 4.1. GPU 部署的软件先决条件
组件最低版本Operator

NVIDIA GPU Operator

24.3

NVIDIA GPU Operator OLM Operator

AMD GPU Operator

6.2

AMD GPU Operator OLM Operator

节点功能发现 [1]

4.14

Node Feature Discovery Operator

[1] 默认包含在 OpenShift Container Platform 中。调度 NUMA 感知工作负载需要 节点功能发现。

第 5 章 生命周期和更新策略

安全及关键程序错误修复以 registry.access.redhat.com/rhaiis 容器 registry 中提供的容器镜像提供,并通过 RHSA 公告进行宣布。如需了解更多详细信息,请参阅 catalog.redhat.com 上的 RHAIIS 容器镜像

法律通告

Copyright © 2025 Red Hat, Inc.
The text of and illustrations in this document are licensed by Red Hat under a Creative Commons Attribution–Share Alike 3.0 Unported license ("CC-BY-SA"). An explanation of CC-BY-SA is available at http://creativecommons.org/licenses/by-sa/3.0/. In accordance with CC-BY-SA, if you distribute this document or an adaptation of it, you must provide the URL for the original version.
Red Hat, as the licensor of this document, waives the right to enforce, and agrees not to assert, Section 4d of CC-BY-SA to the fullest extent permitted by applicable law.
Red Hat, Red Hat Enterprise Linux, the Shadowman logo, the Red Hat logo, JBoss, OpenShift, Fedora, the Infinity logo, and RHCE are trademarks of Red Hat, Inc., registered in the United States and other countries.
Linux® is the registered trademark of Linus Torvalds in the United States and other countries.
Java® is a registered trademark of Oracle and/or its affiliates.
XFS® is a trademark of Silicon Graphics International Corp. or its subsidiaries in the United States and/or other countries.
MySQL® is a registered trademark of MySQL AB in the United States, the European Union and other countries.
Node.js® is an official trademark of Joyent. Red Hat is not formally related to or endorsed by the official Joyent Node.js open source or commercial project.
The OpenStack® Word Mark and OpenStack logo are either registered trademarks/service marks or trademarks/service marks of the OpenStack Foundation, in the United States and other countries and are used with the OpenStack Foundation's permission. We are not affiliated with, endorsed or sponsored by the OpenStack Foundation, or the OpenStack community.
All other trademarks are the property of their respective owners.
返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat