第 3 章 用于 IBM Z 和 IBM Spyre AI 加速器的验证模型
带有 IBM Spyre AI 加速器的 IBM Z 系统支持以下大型语言模型。
注意
IBM Spyre AI 加速器卡只支持 FP16 格式模型权重。对于兼容模型,Red Hat AI Inference Server inference 引擎在启动时自动将权重转换为 FP16。不需要额外的配置。
| model | Hugging Face model 卡 |
|---|---|
| granite-3.3-8b-instruct |
重要
预构建的 IBM Granite 模型使用 Red Hat AI Inference Server Spyre 容器镜像中包含的特定 Python 软件包运行。模型与 Spyre 卡数、批处理大小和输入/输出上下文大小的固定配置相关联。
不支持更新或替换 Red Hat AI Inference Server Spyre 容器镜像中的 Python 软件包。