3.2. 查看 NIM 模型的 NVIDIA NIM 指标
在 OpenShift AI 中,您可以观察在 NVIDIA NIM 模型服务平台上部署的 NIM 模型的以下 NVIDIA NIM 指标:
- GPU 缓存使用量随时间(ms)
- 当前正在运行、等待和最大请求计数
- 令牌计数
- 第一次令牌
- 每个输出令牌的时间
- 请求结果
您可以为这些指标指定时间范围和刷新间隔,以帮助您决定在指定时间的峰值使用小时和型号性能。
先决条件
- 您已启用了 NVIDIA NIM 模型服务平台。
- 您已在 NVIDIA NIM 模型服务平台上部署了 NIM 模型。
- 集群管理员为您的部署启用了指标集合和图形生成。
disableKServeMetricsOpenShift AI 仪表板配置选项被设置为默认值false:disableKServeMetrics: false
disableKServeMetrics: falseCopy to Clipboard Copied! Toggle word wrap Toggle overflow 有关设置仪表板配置选项的更多信息,请参阅 自定义仪表板。
流程
在 OpenShift AI 仪表板导航菜单中点 Projects。
Projects 页面将打开。
- 点击包含您要监控的 NIM 模型的项目名称。
- 在项目详细信息页面中,单击 Deployments 选项卡。
- 点击您要观察的 NIM 模型。
在 NIM Metrics 选项卡中,设置以下选项:
- 时间范围 -指定跟踪指标的时长。您可以选择其中一个值:1 小时、24 小时、7 天和 30 天。
- 刷新 interval - 指定指标页面中图形的频率(显示最新的数据)。您可以选择以下值之一:15 秒、30 秒、1 分钟、5 分钟、15 分钟、30 分钟、1 小时、2 小时和 1 天。
- 向下滚动以查看 NIM 指标的数据图形。
验证
NIM Metrics 选项卡显示所部署的 NIM 模型的 NIM 指标图。
其他资源