第 2 章 配置 TrustyAI
要为数据科学家在 OpenShift AI 中配置带有 TrustyAI 的模型监控,集群管理员需要执行以下任务:
- 为模型服务平台配置监控
- 在 Red Hat OpenShift AI Operator 中启用 TrustyAI 组件
- 如果要使用数据库而不是带有 TrustyAI 的存储的 PVC,将 TrustyAI 配置为使用数据库。
- 在包含数据科学家要监控的模型的每个数据科学项目上安装 TrustyAI 服务
2.1. 为您的模型服务平台配置监控 复制链接链接已复制到粘贴板!
OpenShift AI 提供以下模型服务平台:
为单个(KServe)或多模型(ModelMesh)服务平台配置监控的过程相同。
先决条件
- 具有集群管理员特权。
- 您已下载并安装 OpenShift 命令行界面 (CLI)。请参阅安装 OpenShift CLI。
- 您熟悉为监控用户定义的工作流 创建配置映射。您将在此流程中执行类似的步骤。
- 您熟悉 为 OpenShift 中的用户定义的项目启用监控。您将在此流程中执行类似的步骤。
-
您已将
monitoring-rules-view
角色分配给将监控指标的用户。https://docs.redhat.com/en/documentation/openshift_container_platform/4.17/html/monitoring/enabling-monitoring-for-user-defined-projects#granting-users-permission-to-monitor-user-defined-projects_enabling-monitoring-for-user-defined-projects
流程
在一个终端窗口中,如果您还没有以集群管理员登录到 OpenShift 集群,请登录 OpenShift CLI,如下例所示:
oc login <openshift_cluster_url> -u <admin_username> -p <password>
$ oc login <openshift_cluster_url> -u <admin_username> -p <password>
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 在名为
uwm-cm-conf.yaml
的 YAML 文件中定义ConfigMap
对象,其内容如下:Copy to Clipboard Copied! Toggle word wrap Toggle overflow user-workload-monitoring-config
对象配置监控用户定义的项目的组件。观察到保留时间被设置为推荐的值 15 天。应用配置以创建
user-workload-monitoring-config
对象。oc apply -f uwm-cm-conf.yaml
$ oc apply -f uwm-cm-conf.yaml
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 在名为
uwm-cm-enable.yaml
的 YAML 文件中定义另一个ConfigMap
对象,其内容如下:Copy to Clipboard Copied! Toggle word wrap Toggle overflow cluster-monitoring-config
对象为用户定义的项目启用监控。应用配置以创建
cluster-monitoring-config
对象。oc apply -f uwm-cm-enable.yaml
$ oc apply -f uwm-cm-enable.yaml
Copy to Clipboard Copied! Toggle word wrap Toggle overflow