2.15. 查看单模型服务平台的模型运行时指标
当集群管理员为单模式服务平台配置了监控时,非管理员用户可以使用 OpenShift Web 控制台查看 KServe 组件的模型运行时指标。
先决条件
- 集群管理员为单模式服务平台配置了监控。
-
您已分配了
monitoring-rules-view
角色。如需更多信息,请参阅 授予用户权限来为用户定义的项目配置监控。 - 您熟悉如何在 OpenShift Web 控制台中监控项目指标。如需更多信息,请参阅监控项目指标。
流程
- 登录 OpenShift Web 控制台。
- 切换到 Developer 视角。
- 在左侧菜单中,点 Observe。
如监控 项目指标 中所述,使用 Web 控制台运行对模型运行时指标的查询。您还可以对与 OpenShift Service Mesh 相关的指标运行查询。此时会显示一些示例。
以下查询显示了使用 vLLM 运行时部署模型的时间段内成功推测请求数:
sum(increase(vllm:request_success_total{namespace=${namespace},model_name=${model_name}}[${rate_interval}]))
sum(increase(vllm:request_success_total{namespace=${namespace},model_name=${model_name}}[${rate_interval}]))
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 注意某些 vLLM 指标仅在由部署的模型处理了一个 inference 请求后可用。要生成并查看这些指标,您必须首先对模型发出 inference 请求。
以下查询显示了使用独立 TGIS 运行时部署的模型的成功推测请求数:
sum(increase(tgi_request_success{namespace=${namespace}, pod=~${model_name}-predictor-.*}[${rate_interval}]))
sum(increase(tgi_request_success{namespace=${namespace}, pod=~${model_name}-predictor-.*}[${rate_interval}]))
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下查询显示了使用 Caikit Standalone 运行时部署的模型的成功 inference 请求数量:
sum(increase(predict_rpc_count_total{namespace=${namespace},code=OK,model_id=${model_name}}[${rate_interval}]))
sum(increase(predict_rpc_count_total{namespace=${namespace},code=OK,model_id=${model_name}}[${rate_interval}]))
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下查询显示了使用 OpenVINO Model Server 运行时部署的模型的成功 inference 请求数量:
sum(increase(ovms_requests_success{namespace=${namespace},name=${model_name}}[${rate_interval}]))
sum(increase(ovms_requests_success{namespace=${namespace},name=${model_name}}[${rate_interval}]))
Copy to Clipboard Copied! Toggle word wrap Toggle overflow