第 2 章 支持的 AI 加速器
下表列出了 Red Hat AI Inference Server 3.1 支持的 AI 加速器。
重要
Red Hat AI Inference Server 3.1 与 CUDA 版本不兼容,低于 12.8。
| 容器镜像 | vLLM release | AI 加速器 | 要求 | vLLM 架构支持 | LLM Compressor 支持 |
|---|---|---|---|---|---|
|
| vLLM 0.9.0.1 |
|
| x86 技术预览 |
| 容器镜像 | vLLM release | AI 加速器 | 要求 | vLLM 架构支持 | LLM Compressor 支持 |
|---|---|---|---|---|---|
|
| vLLM 0.8.4 |
| x86 | x86 技术预览 |
| 容器镜像 | vLLM release | AI 加速器 | 要求 | vLLM 架构支持 | LLM Compressor 支持 |
|---|---|---|---|---|---|
|
| vLLM 0.8.5 | Google TPU v6e | x86 开发人员预览 | 不支持 |