2.6. 安装和管理 Red Hat OpenShift AI 组件。
您可以使用 OpenShift Web 控制台在 OpenShift 集群上安装和管理 Red Hat OpenShift AI 组件。
2.6.1. 使用 Web 控制台安装 Red Hat OpenShift AI 组件
当您将 Red Hat OpenShift AI 作为 OpenShift 集群的附加组件安装时,安装过程会自动创建默认的 DataScienceCluster
对象。要使用 OpenShift Web 控制台安装 Red Hat OpenShift AI 组件,您必须配置 DataScienceCluster
对象。
以下流程描述了如何配置 DataScienceCluster
对象,以 作为新 安装的一部分安装 Red Hat OpenShift AI 组件。
- 有关在安装后更改 OpenShift AI 组件的安装状态的详情,请参阅使用 Web 控制台更新 Red Hat OpenShift AI 组件的 安装状态。
- 有关升级 OpenShift AI 的详情,请参考 升级 OpenShift AI Cloud Service。
先决条件
- Red Hat OpenShift AI 作为 Red Hat OpenShift 集群的附加组件安装。
- 有 OpenShift 集群的集群管理员特权。
流程
- 以集群管理员身份登录 OpenShift Web 控制台。
-
在 Web 控制台中,点 Operators
Installed Operators,然后点 Red Hat OpenShift AI Operator。 - 点 Data Science Cluster 选项卡。
- 点 default-dsc 对象。
选择 YAML 选项卡。
嵌入式 YAML 编辑器会打开
DataScienceCluster
对象的默认自定义资源(CR),如下例所示:apiVersion: datasciencecluster.opendatahub.io/v1 kind: DataScienceCluster metadata: name: default-dsc spec: components: codeflare: managementState: Removed dashboard: managementState: Removed datasciencepipelines: managementState: Removed kserve: managementState: Removed 1 2 kueue: managementState: Removed modelmeshserving: managementState: Removed ray: managementState: Removed trainingoperator: managementState: Removed trustyai: managementState: Removed workbenches: managementState: Removed
- 1
- 要完全安装 KServe 组件(由单模型服务平台用来提供大型模型),您必须为 Red Hat OpenShift Service Mesh 和 Red Hat OpenShift Serverless 安装 Operator 并执行额外的配置。请参阅 安装单模式服务平台。
- 2
- 如果您还没有 启用 KServe 组件(即,将
managementState
字段设置为Removed
),还必须禁用依赖 Service Mesh 组件以避免错误。请参阅禁用 KServe 依赖项。
在 CR 的
spec.components
部分中,对于所示的每个 OpenShift AI 组件,将managementState
字段的值设置为Managed
或Removed
。这些值定义如下:- 受管
- Operator 会主动管理组件,安装它,并尝试保持其活跃。只有在组件安全时,Operator 才会升级组件。
- 删除
- Operator 会主动管理组件,但不安装它。如果组件已安装,Operator 将尝试将其删除。
重要- 要了解如何完全安装 KServe 组件(由 single-model 服务平台用来为大型模型提供服务),请参阅安装单model 服务平台。
-
如果您还没有 启用 KServe 组件(即,将
managementState
字段设置为Removed
),还必须禁用依赖 Service Mesh 组件以避免错误。请参阅禁用 KServe 依赖项。 - 要了解如何安装分布式工作负载组件,请参阅安装分布式工作负载组件。
- 点击 Save。
验证
确认每个组件都有一个正在运行的 pod:
-
在 OpenShift Web 控制台中,点击 Workloads
Pods。 -
在页面顶部的 Project 列表中,选择
redhat-ods-applications
。 - 在 applications 命名空间中,确认您安装的每个 OpenShift AI 组件都有运行 pod。
-
在 OpenShift Web 控制台中,点击 Workloads
确认所有安装的组件的状态:
-
在 OpenShift Web 控制台中,点 Operators
Installed Operators。 - 点 Red Hat OpenShift AI Operator。
-
点 Data Science Cluster 选项卡,再选择名为
default-dsc
的DataScienceCluster
对象。 - 选择 YAML 选项卡。
在
installedComponents
部分中,确认您安装的组件的状态为true
。注意如果组件显示 CR 的
spec.components
部分中的component-name: {}
格式,则不会安装该组件。
-
在 OpenShift Web 控制台中,点 Operators
2.6.2. 使用 Web 控制台更新 Red Hat OpenShift AI 组件的安装状态
您可以使用 OpenShift Web 控制台更新 OpenShift 集群中 Red Hat OpenShift AI 组件的安装状态。
如果您升级了 OpenShift AI,升级过程会自动使用之前版本的 DataScienceCluster
对象的值。新组件不会自动添加到 DataScienceCluster
对象中。
升级 OpenShift AI 后:
-
检查默认的
DataScienceCluster
对象,以检查并选择性地更新现有组件的managementState
状态。 -
将任何新组件添加到
DataScienceCluster
对象中。
先决条件
- Red Hat OpenShift AI 作为 Red Hat OpenShift 集群的附加组件安装。
- 具有集群管理员特权。
流程
- 以集群管理员身份登录 OpenShift Web 控制台。
-
在 Web 控制台中,点 Operators
Installed Operators,然后点 Red Hat OpenShift AI Operator。 - 点 Data Science Cluster 选项卡。
-
在 DataScienceClusters 页面中,点
default
对象。 点 YAML 标签。
嵌入式 YAML 编辑器会打开显示
DataScienceCluster
对象的默认自定义资源(CR),如下例所示:apiVersion: datasciencecluster.opendatahub.io/v1 kind: DataScienceCluster metadata: name: default-dsc spec: components: codeflare: managementState: Removed dashboard: managementState: Removed datasciencepipelines: managementState: Removed kserve: managementState: Removed kueue: managementState: Removed modelmeshserving: managementState: Removed ray: managementState: Removed trainingoperator: managementState: Removed trustyai: managementState: Removed workbenches: managementState: Removed
在 CR 的
spec.components
部分中,对于所示的每个 OpenShift AI 组件,将managementState
字段的值设置为Managed
或Removed
。这些值定义如下:- 受管
- Operator 会主动管理组件,安装它,并尝试保持其活跃。只有在组件安全时,Operator 才会升级组件。
- 删除
- Operator 会主动管理组件,但不安装它。如果组件已安装,Operator 将尝试将其删除。
重要- 要了解如何安装 KServe 组件(由单模式服务平台用来为大型模型提供服务),请参阅安装单model服务平台。
-
如果您还没有 启用 KServe 组件(即,将
managementState
字段设置为Removed
),还必须禁用依赖 Service Mesh 组件以避免错误。请参阅禁用 KServe 依赖项。 - 要了解如何安装分布式工作负载功能,请参阅安装分布式工作负载组件。
点击 Save。
对于您更新的任何组件,OpenShift AI 会启动一个推出影响所有 Pod 来使用更新的镜像。
验证
确认每个组件都有一个正在运行的 pod:
-
在 OpenShift Web 控制台中,点击 Workloads
Pods。 -
在页面顶部的 Project 列表中,选择
redhat-ods-applications
。 - 在 applications 命名空间中,确认您安装的每个 OpenShift AI 组件都有运行 pod。
-
在 OpenShift Web 控制台中,点击 Workloads
确认所有安装的组件的状态:
-
在 OpenShift Web 控制台中,点 Operators
Installed Operators。 - 点 Red Hat OpenShift AI Operator。
-
点 Data Science Cluster 选项卡,再选择名为
default-dsc
的DataScienceCluster
对象。 - 选择 YAML 选项卡。
在
installedComponents
部分中,确认您安装的组件的状态为true
。注意如果组件显示 CR 的
spec.components
部分中的component-name: {}
格式,则不会安装该组件。
-
在 OpenShift Web 控制台中,点 Operators