2.6. 安装和管理 Red Hat OpenShift AI 组件。


您可以使用 OpenShift Web 控制台在 OpenShift 集群上安装和管理 Red Hat OpenShift AI 组件。

2.6.1. 使用 Web 控制台安装 Red Hat OpenShift AI 组件

当您将 Red Hat OpenShift AI 作为 OpenShift 集群的附加组件安装时,安装过程会自动创建默认的 DataScienceCluster 对象。要使用 OpenShift Web 控制台安装 Red Hat OpenShift AI 组件,您必须配置 DataScienceCluster 对象。

重要

以下流程描述了如何配置 DataScienceCluster 对象,以 作为新 安装的一部分安装 Red Hat OpenShift AI 组件。

先决条件

  • Red Hat OpenShift AI 作为 Red Hat OpenShift 集群的附加组件安装。
  • 有 OpenShift 集群的集群管理员特权。

流程

  1. 以集群管理员身份登录 OpenShift Web 控制台。
  2. 在 Web 控制台中,点 Operators Installed Operators,然后点 Red Hat OpenShift AI Operator。
  3. Data Science Cluster 选项卡。
  4. default-dsc 对象。
  5. 选择 YAML 选项卡。

    嵌入式 YAML 编辑器会打开 DataScienceCluster 对象的默认自定义资源(CR),如下例所示:

    apiVersion: datasciencecluster.opendatahub.io/v1
    kind: DataScienceCluster
    metadata:
      name: default-dsc
    spec:
      components:
        codeflare:
          managementState: Removed
        dashboard:
          managementState: Removed
        datasciencepipelines:
          managementState: Removed
        kserve:
          managementState: Removed 1 2
        kueue:
          managementState: Removed
        modelmeshserving:
          managementState: Removed
        ray:
          managementState: Removed
        trainingoperator:
          managementState: Removed
        trustyai:
          managementState: Removed
        workbenches:
          managementState: Removed
    1
    要完全安装 KServe 组件(由单模型服务平台用来提供大型模型),您必须为 Red Hat OpenShift Service Mesh 和 Red Hat OpenShift Serverless 安装 Operator 并执行额外的配置。请参阅 安装单模式服务平台
    2
    如果您还没有 启用 KServe 组件(即,将 managementState 字段设置为 Removed),还必须禁用依赖 Service Mesh 组件以避免错误。请参阅禁用 KServe 依赖项
  6. 在 CR 的 spec.components 部分中,对于所示的每个 OpenShift AI 组件,将 managementState 字段的值设置为 ManagedRemoved。这些值定义如下:

    受管
    Operator 会主动管理组件,安装它,并尝试保持其活跃。只有在组件安全时,Operator 才会升级组件。
    删除
    Operator 会主动管理组件,但不安装它。如果组件已安装,Operator 将尝试将其删除。
    重要
  7. 点击 Save

验证

  • 确认每个组件都有一个正在运行的 pod:

    1. 在 OpenShift Web 控制台中,点击 Workloads Pods
    2. 在页面顶部的 Project 列表中,选择 redhat-ods-applications
    3. 在 applications 命名空间中,确认您安装的每个 OpenShift AI 组件都有运行 pod。
  • 确认所有安装的组件的状态:

    1. 在 OpenShift Web 控制台中,点 Operators Installed Operators
    2. 点 Red Hat OpenShift AI Operator。
    3. Data Science Cluster 选项卡,再选择名为 default-dscDataScienceCluster 对象。
    4. 选择 YAML 选项卡。
    5. installedComponents 部分中,确认您安装的组件的状态为 true

      注意

      如果组件显示 CR 的 spec.components 部分中的 component-name: {} 格式,则不会安装该组件。

2.6.2. 使用 Web 控制台更新 Red Hat OpenShift AI 组件的安装状态

您可以使用 OpenShift Web 控制台更新 OpenShift 集群中 Red Hat OpenShift AI 组件的安装状态。

重要

如果您升级了 OpenShift AI,升级过程会自动使用之前版本的 DataScienceCluster 对象的值。新组件不会自动添加到 DataScienceCluster 对象中。

升级 OpenShift AI 后:

  • 检查默认的 DataScienceCluster 对象,以检查并选择性地更新现有组件的 managementState 状态。
  • 将任何新组件添加到 DataScienceCluster 对象中。

先决条件

  • Red Hat OpenShift AI 作为 Red Hat OpenShift 集群的附加组件安装。
  • 具有集群管理员特权。

流程

  1. 以集群管理员身份登录 OpenShift Web 控制台。
  2. 在 Web 控制台中,点 Operators Installed Operators,然后点 Red Hat OpenShift AI Operator。
  3. Data Science Cluster 选项卡。
  4. DataScienceClusters 页面中,点 default 对象。
  5. YAML 标签。

    嵌入式 YAML 编辑器会打开显示 DataScienceCluster 对象的默认自定义资源(CR),如下例所示:

    apiVersion: datasciencecluster.opendatahub.io/v1
    kind: DataScienceCluster
    metadata:
      name: default-dsc
    spec:
      components:
        codeflare:
          managementState: Removed
        dashboard:
          managementState: Removed
        datasciencepipelines:
          managementState: Removed
        kserve:
          managementState: Removed
        kueue:
          managementState: Removed
        modelmeshserving:
          managementState: Removed
        ray:
          managementState: Removed
        trainingoperator:
          managementState: Removed
        trustyai:
          managementState: Removed
        workbenches:
          managementState: Removed
  6. 在 CR 的 spec.components 部分中,对于所示的每个 OpenShift AI 组件,将 managementState 字段的值设置为 ManagedRemoved。这些值定义如下:

    受管
    Operator 会主动管理组件,安装它,并尝试保持其活跃。只有在组件安全时,Operator 才会升级组件。
    删除
    Operator 会主动管理组件,但不安装它。如果组件已安装,Operator 将尝试将其删除。
    重要
  7. 点击 Save

    对于您更新的任何组件,OpenShift AI 会启动一个推出影响所有 Pod 来使用更新的镜像。

验证

  • 确认每个组件都有一个正在运行的 pod:

    1. 在 OpenShift Web 控制台中,点击 Workloads Pods
    2. 在页面顶部的 Project 列表中,选择 redhat-ods-applications
    3. 在 applications 命名空间中,确认您安装的每个 OpenShift AI 组件都有运行 pod。
  • 确认所有安装的组件的状态:

    1. 在 OpenShift Web 控制台中,点 Operators Installed Operators
    2. 点 Red Hat OpenShift AI Operator。
    3. Data Science Cluster 选项卡,再选择名为 default-dscDataScienceCluster 对象。
    4. 选择 YAML 选项卡。
    5. installedComponents 部分中,确认您安装的组件的状态为 true

      注意

      如果组件显示 CR 的 spec.components 部分中的 component-name: {} 格式,则不会安装该组件。

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.