11.2. 安装 DPU Operator
您可以在集群中安装数据处理单元 (DPU) Operator 来管理 DPU 设备和网络附加。在主机集群和所有 DPU 集群上安装 DPU Operator。DPU Operator 管理所有支持的 DPU 的生命周期。
作为集群管理员,您可以使用 OpenShift Container Platform CLI 或 Web 控制台安装 DPU Operator。
您需要在主机集群以及每个 DPU 集群中安装 DPU Operator。
11.2.1. 使用 CLI 安装 DPU Operator 复制链接链接已复制到粘贴板!
作为集群管理员,您可以使用 CLI 安装 DPU Operator。
CLI 必须在 DPU 集群上安装 DPU Operator。
先决条件
-
安装 OpenShift CLI(
oc
)。 -
具有
cluster-admin
特权的帐户。
流程
输入以下命令来创建
openshift-dpu-operator
命名空间:Copy to Clipboard Copied! Toggle word wrap Toggle overflow 输入以下命令来创建
OperatorGroup
自定义资源 (CR):Copy to Clipboard Copied! Toggle word wrap Toggle overflow 输入以下命令为 DPU Operator 创建
Subscription
CR:Copy to Clipboard Copied! Toggle word wrap Toggle overflow
验证
要验证是否已安装 Operator,请输入以下命令,然后检查 Operator 的输出显示
Succeeded
:oc get csv -n openshift-dpu-operator \ -o custom-columns=Name:.metadata.name,Phase:.status.phase
$ oc get csv -n openshift-dpu-operator \ -o custom-columns=Name:.metadata.name,Phase:.status.phase
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 进入
openshift-dpu-operator
项目:oc project openshift-dpu-operator
$ oc project openshift-dpu-operator
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 输入以下命令验证 DPU Operator 是否正在运行:
oc get pods -n openshift-dpu-operator
$ oc get pods -n openshift-dpu-operator
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 输出示例
NAME READY STATUS RESTARTS AGE dpu-operator-controller-manager-6b7bbb5db8-7lvkj 2/2 Running 0 2m9s
NAME READY STATUS RESTARTS AGE dpu-operator-controller-manager-6b7bbb5db8-7lvkj 2/2 Running 0 2m9s
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
11.2.2. 使用 Web 控制台安装 DPU Operator 复制链接链接已复制到粘贴板!
作为集群管理员,您可以使用 Web 控制台安装 DPU Operator。
先决条件
-
安装 OpenShift CLI(
oc
)。 -
具有
cluster-admin
特权的帐户。
流程
-
在 OpenShift Container Platform Web 控制台中,点击 Operators
OperatorHub。 - 从可用的 Operator 列表中选择 DPU Operator,然后点 Install。
在 Install Operator 页中,在 Installed Namespace 下,默认预先选择 Operator recommended Namespace 选项。不需要操作。
- 点 Install。
验证
-
导航到 Operators
Installed Operators 页面。 确保 openshift-dpu-operator 项目中列出的 DPU Operator 的 Status 为 InstallSucceeded。
注意在安装过程中,Operator 可能会显示 Failed 状态。如果安装过程结束后有 InstallSucceeded 信息,您可以忽略这个 Failed 信息。
故障排除
- 检查 Operator Subscriptions 和 Install Plans 选项卡中的 Status 项中是否有任何错误。
-
进入到 Workloads
Pods 页,在 openshift-dpu-operator
项目中检查 pod 的日志。 检查 YAML 文件的命名空间。如果缺少注解,您可以使用以下命令将注解
workload.openshift.io/allowed=management
添加到 Operator 命名空间中:oc annotate ns/openshift-dpu-operator workload.openshift.io/allowed=management
$ oc annotate ns/openshift-dpu-operator workload.openshift.io/allowed=management
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 注意对于单节点 OpenShift 集群,命名空间需要注解
workload.openshift.io/allowed=management
。