第 4 章 使用 Web 控制台更新 Red Hat OpenShift AI 组件的安装状态
您可以使用 OpenShift Web 控制台更新 OpenShift 集群中 Red Hat OpenShift AI 组件的安装状态。
如果您升级了 OpenShift AI,升级过程会自动使用之前版本的 DataScienceCluster
对象的值。新组件不会自动添加到 DataScienceCluster
对象中。
升级 OpenShift AI 后:
-
检查默认的
DataScienceCluster
对象,以检查并选择性地更新现有组件的managementState
状态。 -
将任何新组件添加到
DataScienceCluster
对象中。
先决条件
- Red Hat OpenShift AI Operator 安装在 OpenShift 集群中。
- 具有集群管理员特权。
流程
- 以集群管理员身份登录 OpenShift Web 控制台。
-
在 Web 控制台中,点 Operators
Installed Operators,然后点 Red Hat OpenShift AI Operator。 - 点 Data Science Cluster 选项卡。
-
在 DataScienceClusters 页面中,点
default
对象。 点 YAML 标签。
嵌入式 YAML 编辑器会打开显示
DataScienceCluster
对象的默认自定义资源(CR),如下例所示:Copy to Clipboard Copied! Toggle word wrap Toggle overflow 在 CR 的
spec.components
部分中,对于所示的每个 OpenShift AI 组件,将managementState
字段的值设置为Managed
或Removed
。这些值定义如下:- 受管
- Operator 会主动管理组件,安装它,并尝试保持其活跃。只有在组件安全时,Operator 才会升级组件。
- 删除
- Operator 会主动管理组件,但不安装它。如果组件已安装,Operator 将尝试将其删除。
重要- 要了解如何安装 KServe 组件(由单模式服务平台用来为大型模型提供服务),请参阅安装单model服务平台。
-
如果您还没有 启用 KServe 组件(即,将
managementState
字段设置为Removed
),还必须禁用依赖 Service Mesh 组件以避免错误。请参阅禁用 KServe 依赖项。 - 要了解如何安装分布式工作负载功能,请参阅安装分布式工作负载组件。
- 要了解如何在断开连接的环境中运行分布式工作负载,请参阅 在断开连接的环境中运行分布式数据科学工作负载。
点击 Save。
对于您更新的任何组件,OpenShift AI 会启动一个推出影响所有 Pod 来使用更新的镜像。
验证
确认每个组件都有一个正在运行的 pod:
-
在 OpenShift Web 控制台中,点击 Workloads
Pods。 -
在页面顶部的 Project 列表中,选择
redhat-ods-applications
。 - 在 applications 命名空间中,确认您安装的每个 OpenShift AI 组件都有运行 pod。
-
在 OpenShift Web 控制台中,点击 Workloads
确认所有安装的组件的状态:
-
在 OpenShift Web 控制台中,点 Operators
Installed Operators。 - 点 Red Hat OpenShift AI Operator。
-
点 Data Science Cluster 选项卡,再选择名为
default-dsc
的DataScienceCluster
对象。 - 选择 YAML 选项卡。
在
installedComponents
部分中,确认您安装的组件的状态为true
。注意如果组件显示 CR 的
spec.components
部分中的component-name: {}
格式,则不会安装该组件。
-
在 OpenShift Web 控制台中,点 Operators