第 2 章 启用加速器


在 OpenShift AI 中使用加速器前,您必须安装相关的软件组件。安装过程因加速器类型而异。

先决条件

  • 已登陆到 OpenShift 集群。
  • 在 OpenShift 集群中具有 cluster-admin 角色。
  • 已安装加速器,并确认它已在您的环境中检测到。

流程

  1. 按照适当的文档启用加速器:

  2. 安装加速器后,创建一个加速器配置集,如: 使用加速器配置集 中所述。

    重要

    默认情况下,硬件配置集在仪表板导航菜单和用户界面中隐藏,而加速器配置集保持可见。另外,与已弃用的加速器配置集功能关联的用户界面组件仍然会显示。要在仪表板导航菜单中显示 Settings Hardware profiles 选项,以及与硬件配置集关联的用户界面组件,请在 OpenShift 中的 OdhDashboardConfig 自定义资源(CR)中将 disableHardwareProfiles 值设置为 false。有关设置仪表板配置选项的更多信息,请参阅 自定义仪表板

验证

  • Administrator 视角中,进入 Operators Installed Operators 页面。确认出现以下 Operator:

    • 加速器的 Operator
    • 节点功能发现(NFD)
    • 内核模块管理(KMM)
  • 在完成 Node Feature Discovery (NFD)和相关加速器 Operator 后,加速器会被正确检测到。OpenShift 命令行界面(CLI)显示 GPU worker 节点的适当输出。例如,输出是输出,确认检测到 NVIDIA GPU:

    # Expected output when the accelerator is detected correctly
    oc describe node <node name>
    ...
    Capacity:
      cpu:                4
      ephemeral-storage:  313981932Ki
      hugepages-1Gi:      0
      hugepages-2Mi:      0
      memory:             16076568Ki
      nvidia.com/gpu:     1
      pods:               250
    Allocatable:
      cpu:                3920m
      ephemeral-storage:  288292006229
      hugepages-1Gi:      0
      hugepages-2Mi:      0
      memory:             12828440Ki
      nvidia.com/gpu:     1
      pods:               250
    Copy to Clipboard Toggle word wrap
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2026 Red Hat
返回顶部