8.5. 配置 CodeFlare Operator
如果要更改 OpenShift AI 中分布式工作负载的 CodeFlare Operator 的默认配置,您可以编辑关联的配置映射。
先决条件
-
已使用
cluster-admin
角色登录 OpenShift。 - 您已安装了所需的分布式工作负载组件,如 安装分布式工作负载组件 中所述。
步骤
-
在 OpenShift 控制台中,点击 Workloads
ConfigMaps。 - 从 Project 列表中,选择 redhat-ods-applications。
- 搜索 codeflare-operator-config 配置映射,然后点击配置映射名称打开 ConfigMap 详情页面。
- 点 YAML 选项卡显示配置映射规格。
在
data:config.yaml:kuberay
部分中,您可以编辑以下条目:- ingressDomain
此配置选项默认为 null (
ingressDomain: ""
)。不要更改这个选项,除非 Ingress Controller 没有在 OpenShift 中运行。OpenShift AI 使用这个值为每个 Ray 集群生成仪表板和客户端路由,如下例所示:仪表板和客户端路由示例
ray-dashboard-<clustername>-<namespace>.<your.ingress.domain> ray-client-<clustername>-<namespace>.<your.ingress.domain>
ray-dashboard-<clustername>-<namespace>.<your.ingress.domain> ray-client-<clustername>-<namespace>.<your.ingress.domain>
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - mTLSEnabled
默认启用此配置选项(
mTLSEnabled: true
)。启用此选项时,Ray Cluster pod 会创建用于 mutual Transport Layer Security (mTLS)的证书,在 Ray Cluster 节点之间采用 mutual 身份验证。启用这个选项后,Ray 客户端无法连接到 Ray head 节点,除非它们从ca-secret-_<cluster_name>_
secret 下载生成的证书,为 mTLS 通信生成必要的证书,然后设置所需的 Ray 环境变量。然后,用户必须重新初始化 Ray 客户端才能应用更改。CodeFlare SDK 提供以下功能来简化 Ray 客户端的身份验证过程:Ray 客户端身份验证代码示例
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - rayDashboardOauthEnabled
默认情况下启用此配置选项(
RayDashboardOAuthEnabled: true
)。启用此选项后,OpenShift AI 将 OpenShift OAuth 代理放在 Ray Cluster head 节点前面。然后,在通过浏览器访问 Ray 仪表板时,用户必须使用其 OpenShift 集群登录凭据进行身份验证。如果用户想要以另一种方式访问 Ray Dashboard (例如,使用 RayJobSubmissionClient
类),则必须设置一个授权标头作为请求的一部分,如下例所示:授权标头示例
{Authorization: "Bearer <your-openshift-token>"}
{Authorization: "Bearer <your-openshift-token>"}
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
- 要保存您的更改,请点击 Save。
要应用您的更改,请删除 pod:
-
点击 Workloads
Pods。 - 查找 codeflare-operator-manager- <pod-id> pod。
- 点该 pod 的选项菜单(3.3.0),然后点 Delete Pod。pod 会按照应用您的更改重启。
-
点击 Workloads
验证
检查 codeflare-operator-manager pod 的状态,如下所示:
-
在 OpenShift 控制台中,点击 Workloads
Deployments。 - 搜索 codeflare-operator-manager 部署,然后单击部署名称以打开部署详情页面。
- 点 Pods 选项卡。当 codeflare-operator-manager- <pod-id> pod 的状态为 Running 时,pod 就可以使用。要查看有关 pod 的更多信息,请点 pod 名称以打开 pod 详情页面,然后点 Logs 选项卡。