第 6 章 使用加速器配置集
加速器配置集现已弃用。要针对工作台或模型服务工作负载的特定 worker 节点,请使用硬件配置集。默认情况下,加速器配置集功能仍然显示在仪表板导航菜单中,而硬件配置集功能会被隐藏。
要在仪表板导航菜单中禁用加速器配置集,请在 OpenShift 中的 OdhDashboardConfig 自定义资源(CR)中将 disableAcceleratorProfiles 值设置为 true。要启用硬件配置集,在同一 CR 中将 disableHardwareProfiles 值设置为 false。
注: spec.dashboardConfig.disableAcceleratorProfiles 选项由 spec.dashboardConfig.disableHardwareProfiles 选项替代。如果这两个选项都设置为 false,则 disableHardwareProfiles 选项会覆盖 disableAcceleratorProfiles 选项,并在仪表板导航菜单中显示 Settings
有关设置仪表板配置选项的更多信息,请参阅 自定义仪表板。
红帽建议您尽快将任何现有的加速器配置集迁移到硬件配置集,以确保继续支持和兼容性。
要为您的数据科学家配置加速器,以便在 OpenShift AI 中使用,您必须创建一个关联的加速器配置集。加速器配置集是 OpenShift 上的自定义资源定义(CRD),它带有一个 AcceleratorProfile 资源,并定义加速器的规格。您可以通过在 OpenShift AI 仪表板上选择 Settings
对于部署的新加速器,您必须手动为每个加速器配置加速器配置集。如果您的部署包含加速器,则升级后相关的加速器配置集会保留。您可以通过将特定的加速器配置集分配给自定义工作台镜像来管理在数据科学家中出现的加速器。本例演示了 Habana Gaudi 1 加速器配置集的代码:
---
apiVersion: dashboard.opendatahub.io/v1alpha
kind: AcceleratorProfile
metadata:
name: hpu-profile-first-gen-gaudi
spec:
displayName: Habana HPU - 1st Gen Gaudi
description: First Generation Habana Gaudi device
enabled: true
identifier: habana.ai/gaudi
tolerations:
- effect: NoSchedule
key: habana.ai/gaudi
operator: Exists
---
加速器配置集代码在 AcceleratorProfile 自定义资源定义(CRD)的详细信息页面上显示。有关加速器配置集属性的更多信息,请参阅下表:
| 属性 | 类型 | 必填 | 描述 |
|---|---|---|---|
| displayName | 字符串 | 必填 | 加速器配置集的显示名称。 |
| description | 字符串 | 选填 | 定义加速器配置集的描述性文本。 |
| identifier | 字符串 | 必填 | 定义加速器资源的唯一标识符。 |
| enabled | 布尔值 | 必填 | 决定加速器是否在 OpenShift AI 中可见。 |
| 容限(tolerations) | Array | 选填 | 适用于工作台和提供使用加速器的运行时的容限。如需有关 OpenShift AI 中容限属性的更多信息,请参阅 Toleration v1 core。 |
6.1. 查看加速器配置集 复制链接链接已复制到粘贴板!
如果您为 OpenShift AI 定义了加速器配置集,您可以从 加速器配置集 页面查看、启用和禁用它们。
先决条件
- 您已以具有 OpenShift AI 管理员特权的用户身份登录到 OpenShift AI。
- 您的部署包含现有的加速器配置集。
流程
在 OpenShift AI 仪表板中点 Settings
Accelerator profiles。 加速器配置集 页面将打开,显示现有的加速器配置集。
- 检查加速器配置集列表。要在包含加速器配置集的行中启用或禁用加速器配置集,点 Enable 列中的切换。
验证
- 加速器配置集 页面将打开,显示现有的加速器配置集。