3.2. 为现有 NIM 部署启用 NVIDIA NIM 指标


如果您之前在 OpenShift AI 中部署了 NIM 模型,然后升级到最新版本,则必须通过添加注解启用指标集合和图形生成来手动为现有部署启用 NIM 指标。

注意

最新版本的 OpenShift AI 中的新部署会自动启用 NIM 指标和图形。

3.2.1. 为现有 NIM 部署启用图形生成

以下流程描述了如何为现有 NIM 部署启用图形生成。

先决条件

流程

  1. 在一个终端窗口中,如果您还没有以集群管理员身份登录到 OpenShift 集群,请登录 OpenShift CLI。
  2. 确认与 NIM 部署关联的 ServingRuntime 的名称:

    oc get servingruntime -n <namespace>
    Copy to Clipboard Toggle word wrap

    &lt;namespace> 替换为部署 NIM 模型的项目的命名空间。

  3. 检查 ServingRuntime 配置中现有的 metadata.annotations 部分:

    oc get servingruntime -n  <namespace> <servingruntime-name> -o json | jq '.metadata.annotations'
    Copy to Clipboard Toggle word wrap

    将 <servingruntime-name> 替换为上一步中的 ServingRuntime 的名称。

  4. 执行以下操作之一:

    1. 如果配置中没有 metadata.annotations 部分,请使用所需注解添加部分:

      oc patch servingruntime -n <namespace> <servingruntime-name> --type json --patch \
       '[{"op": "add", "path": "/metadata/annotations", "value": {"runtimes.opendatahub.io/nvidia-nim": "true"}}]'
      Copy to Clipboard Toggle word wrap

      您会看到类似如下的输出:

      servingruntime.serving.kserve.io/nim-serving-runtime patched
      Copy to Clipboard Toggle word wrap
    2. 如果已存在 metadata.annotations 部分,请将所需的注解添加到部分中:

      oc patch servingruntime -n <project-namespace> <runtime-name> --type json --patch \
       '[{"op": "add", "path": "/metadata/annotations/runtimes.opendatahub.io~1nvidia-nim", "value": "true"}]'
      Copy to Clipboard Toggle word wrap

      您会看到类似如下的输出:

      servingruntime.serving.kserve.io/nim-serving-runtime patched
      Copy to Clipboard Toggle word wrap

验证

  • 确认注解已添加到现有 NIM 部署的 ServingRuntime 中。

    oc get servingruntime -n <namespace> <servingruntime-name> -o json | jq '.metadata.annotations'
    Copy to Clipboard Toggle word wrap

    您添加的注解会显示在输出中:

    ...
    "runtimes.opendatahub.io/nvidia-nim": "true"
    Copy to Clipboard Toggle word wrap
    注意

    要使指标可用于图形生成,还必须为您的部署启用指标集合。请参阅 为现有 NIM 部署启用指标集合

3.2.2. 为现有 NIM 部署启用指标集合

要为现有 NIM 部署启用指标集合,您必须手动将 Prometheus 端点和端口注解添加到部署的 InferenceService 中。

以下流程描述了如何将所需的 Prometheus 注解添加到 NIM 部署的 InferenceService 中。

先决条件

流程

  1. 在一个终端窗口中,如果您还没有以集群管理员身份登录到 OpenShift 集群,请登录 OpenShift CLI。
  2. 确认与 NIM 部署关联的 InferenceService 的名称:

    oc get inferenceservice -n <namespace>
    Copy to Clipboard Toggle word wrap

    &lt;namespace> 替换为部署 NIM 模型的项目的命名空间。

  3. 检查 InferenceService 配置中是否存在现有的 spec.predictor.annotations 部分:

    oc get inferenceservice -n <namespace> <inferenceservice-name> -o json | jq '.spec.predictor.annotations'
    Copy to Clipboard Toggle word wrap

    将 <inferenceservice-name> 替换为上一步中的 InferenceService 的名称。

  4. 执行以下操作之一:

    1. 如果配置中不存在 spec.predictor.annotations 部分,请添加这个部分和所需的注解:

      oc patch inferenceservice -n <namespace> <inference-name> --type json --patch \
       '[{"op": "add", "path": "/spec/predictor/annotations", "value": {"prometheus.io/path": "/metrics", "prometheus.io/port": "8000"}}]'
      Copy to Clipboard Toggle word wrap

      您添加的注解会显示在输出中:

      inferenceservice.serving.kserve.io/nim-serving-runtime patched
      Copy to Clipboard Toggle word wrap
    2. 如果已存在 spec.predictor.annotations 部分,请将 Prometheus 注解添加到部分中:

      oc patch inferenceservice -n <namespace> <inference-service-name> --type json --patch \
       '[{"op": "add", "path": "/spec/predictor/annotations/prometheus.io~1path", "value": "/metrics"},
       {"op": "add", "path": "/spec/predictor/annotations/prometheus.io~1port", "value": "8000"}]'
      Copy to Clipboard Toggle word wrap

      您添加的注解会显示在输出中:

      inferenceservice.serving.kserve.io/nim-serving-runtime patched
      Copy to Clipboard Toggle word wrap

验证

  • 确认注解已添加到 InferenceService 中。

    oc get inferenceservice -n <namespace> <inferenceservice-name> -o json | jq '.spec.predictor.annotations'
    Copy to Clipboard Toggle word wrap

    您会看到您在输出中添加的注解:

    {
      "prometheus.io/path": "/metrics",
      "prometheus.io/port": "8000"
    }
    Copy to Clipboard Toggle word wrap
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2026 Red Hat
返回顶部