第 2 章 启用加速器
在 OpenShift AI 中使用加速器前,您必须安装相关的软件组件。安装过程因加速器类型而异。
先决条件
- 已登陆到 OpenShift 集群。
-
在 OpenShift 集群中具有
cluster-admin角色。 - 已安装加速器,并确认它已在您的环境中检测到。
流程
按照适当的文档启用加速器:
- NVIDIA GPU : 请参阅启用 NVIDIA GPU。
- Intel Gaudi AI Accelerators : 请参阅启用 Intel Gaudi AI Accelerators。
- AMD GPU : 请参阅启用 AMD GPU。
安装加速器后,创建一个加速器配置集,如: 使用加速器配置集 中所述。
重要默认情况下,硬件配置集在仪表板导航菜单和用户界面中隐藏,而加速器配置集保持可见。另外,与已弃用的加速器配置集功能关联的用户界面组件仍然会显示。要在仪表板导航菜单中显示 Settings
Hardware profiles 选项,以及与硬件配置集关联的用户界面组件,请在 OpenShift 中的 OdhDashboardConfig自定义资源(CR)中将disableHardwareProfiles值设置为false。有关设置仪表板配置选项的更多信息,请参阅 自定义仪表板。
验证
从 Administrator 视角中,进入 Operators
Installed Operators 页面。确认出现以下 Operator: - 加速器的 Operator
- 节点功能发现(NFD)
- 内核模块管理(KMM)
在完成 Node Feature Discovery (NFD)和相关加速器 Operator 后,加速器会被正确检测到。OpenShift 命令行界面(CLI)显示 GPU worker 节点的适当输出。例如,输出是输出,确认检测到 NVIDIA GPU:
Copy to Clipboard Copied! Toggle word wrap Toggle overflow