第 3 章 用于 IBM Z 和 IBM Spyre AI 加速器的验证模型


带有 IBM Spyre AI 加速器的 IBM Z 系统支持以下大型语言模型。

注意

IBM Spyre AI 加速器卡只支持 FP16 格式模型权重。对于兼容模型,Red Hat AI Inference Server inference 引擎在启动时自动将权重转换为 FP16。不需要额外的配置。

Expand
表 3.1. 用于 IBM Spyre AI Accelerators 的解码器模型
modelHugging Face model 卡

granite-3.3-8b-instruct

ibm-granite/granite-3.3-8b-instruct

重要

预构建的 IBM Granite 模型使用 Red Hat AI Inference Server Spyre 容器镜像中包含的特定 Python 软件包运行。模型与 Spyre 卡数、批处理大小和输入/输出上下文大小的固定配置相关联。

不支持更新或替换 Red Hat AI Inference Server Spyre 容器镜像中的 Python 软件包。

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat