第 3 章 安装 Node Feature Discovery Operator 和 NVIDIA GPU Operator
安装 Node Feature Discovery Operator 和 NVIDIA GPU Operator,供您使用底层主机 AI 加速器。
先决条件
-
已安装 OpenShift CLI(
oc)。 -
您已以具有
cluster-admin权限的用户身份登录。 - 您已成功在断开连接的环境中镜像所需的 Operator 镜像。
流程
禁用默认的 OperatorHub 源。运行以下命令:
oc patch OperatorHub cluster --type json \ -p '[{"op": "add", "path": "/spec/disableAllDefaultSources", "value": true}]'$ oc patch OperatorHub cluster --type json \ -p '[{"op": "add", "path": "/spec/disableAllDefaultSources", "value": true}]'Copy to Clipboard Copied! Toggle word wrap Toggle overflow 为 Node Feature Discovery Operator 和 NVIDIA GPU Operator 应用
Namespace、OperatorGroup和SubscriptionCR。创建
NamespaceCR:Copy to Clipboard Copied! Toggle word wrap Toggle overflow 创建
OperatorGroupCR:Copy to Clipboard Copied! Toggle word wrap Toggle overflow 创建
SubscriptionCR:Copy to Clipboard Copied! Toggle word wrap Toggle overflow
为 Hugging Face 令牌创建
Secret自定义资源(CR)。使用您在 Hugging Face 中设置的令牌,设置
HF_TOKEN变量。HF_TOKEN=<your_huggingface_token>
$ HF_TOKEN=<your_huggingface_token>Copy to Clipboard Copied! Toggle word wrap Toggle overflow 将集群命名空间设置为与部署 Red Hat AI Inference Server 镜像的位置匹配,例如:
NAMESPACE=rhaiis-namespace
$ NAMESPACE=rhaiis-namespaceCopy to Clipboard Copied! Toggle word wrap Toggle overflow 在集群中创建
SecretCR:oc create secret generic hf-secret --from-literal=HF_TOKEN=$HF_TOKEN -n $NAMESPACE
$ oc create secret generic hf-secret --from-literal=HF_TOKEN=$HF_TOKEN -n $NAMESPACECopy to Clipboard Copied! Toggle word wrap Toggle overflow
验证
运行以下命令验证 Operator 部署是否成功:
oc get pods
$ oc get pods
输出示例