3.2. 查看 NIM 模型的 NVIDIA NIM 指标


在 OpenShift AI 中,您可以观察在 NVIDIA NIM 模型服务平台上部署的 NIM 模型的以下 NVIDIA NIM 指标:

  • GPU 缓存使用量随时间(ms)
  • 当前正在运行、等待和最大请求计数
  • 令牌计数
  • 第一次令牌
  • 每个输出令牌的时间
  • 请求结果

您可以为这些指标指定时间范围和刷新间隔,以帮助您决定在指定时间的峰值使用小时和型号性能。

先决条件

  • 您已启用了 NVIDIA NIM 模型服务平台。
  • 您已在 NVIDIA NIM 模型服务平台上部署了 NIM 模型。
  • 集群管理员为您的部署启用了指标集合和图形生成。
  • disableKServeMetrics OpenShift AI 仪表板配置选项被设置为默认值 false

    disableKServeMetrics: false
    Copy to Clipboard Toggle word wrap

    有关设置仪表板配置选项的更多信息,请参阅 自定义仪表板

流程

  1. 在 OpenShift AI 仪表板导航菜单中点 Projects

    Projects 页面将打开。

  2. 点击包含您要监控的 NIM 模型的项目名称。
  3. 在项目详细信息页面中,单击 Deployments 选项卡。
  4. 点击您要观察的 NIM 模型。
  5. NIM Metrics 选项卡中,设置以下选项:

    • 时间范围 -指定跟踪指标的时长。您可以选择其中一个值:1 小时、24 小时、7 天和 30 天。
    • 刷新 interval - 指定指标页面中图形的频率(显示最新的数据)。您可以选择以下值之一:15 秒、30 秒、1 分钟、5 分钟、15 分钟、30 分钟、1 小时、2 小时和 1 天。
  6. 向下滚动以查看 NIM 指标的数据图形。

验证

NIM Metrics 选项卡显示所部署的 NIM 模型的 NIM 指标图。

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat