4.10. 查看已部署模型的 HTTP 请求指标
您可以查看说明在多模式服务平台上部署的特定模型失败的 HTTP 请求或成功的图形。
先决条件
- 已安装 Red Hat OpenShift AI。
- 在安装 OpenShift AI 的 OpenShift 集群上,启用了用户工作负载监控。
以下仪表板配置选项被设置为默认值,如下所示:
disablePerformanceMetrics:false disableKServeMetrics:false
disablePerformanceMetrics:false disableKServeMetrics:falseCopy to Clipboard Copied! Toggle word wrap Toggle overflow 有关设置仪表板配置选项的更多信息,请参阅 自定义仪表板。
- 您已登陆到 Red Hat OpenShift AI。
- 您已在多模式服务平台上部署了模型。
流程
-
在 OpenShift AI 仪表板中点 AI hub
Deployments。 - 在 Deployments 页面上,选择您感兴趣的模型。
可选:在 Endpoint performance 选项卡中设置以下选项:
- 时间范围 -指定跟踪指标的时长。您可以选择其中一个值:1 小时、24 小时、7 天和 30 天。
- 刷新 interval - 指定指标页面中图形的频率(显示最新的数据)。您可以选择以下值之一:15 秒、30 秒、1 分钟、5 分钟、15 分钟、30 分钟、1 小时、2 小时和 1 天。
验证
Endpoint performance 选项卡显示模型的 HTTP 指标图。