第 3 章 在 NVIDIA NIM 模型服务平台上管理和监控模型
作为集群管理员,您可以在 NVIDIA NIM 模型服务平台上管理和监控模型。您可以自定义 NVIDIA NIM 模型选择选项,并为 NIM 模型启用指标,以及其他任务。
3.1. 为 NVIDIA NIM 模型服务平台自定义模型选择选项 复制链接链接已复制到粘贴板!
NVIDIA NIM 模型服务平台提供对 NVIDIA GPU Cloud (NGC)中所有可用 NVIDIA NIM 模型的访问。您可以通过从 Deploy model 对话框中的 NVIDIA NIM 列表中选择它来部署 NIM 模型。要自定义列表中出现的模型,您可以创建一个指定您首选的模型的 ConfigMap 对象。
先决条件
- 具有集群管理员特权。
- 您有一个 NVIDIA Cloud Account (NCA),并可以访问 NVIDIA GPU Cloud (NGC)门户。
您知道要在 NVIDIA NIM 模型服务平台上选择的 NVIDIA NIM 模型的 ID。
注意- 您可以从 NGC Catalog 找到模型 ID。ID 通常是 URL 路径的一部分。
- 您还可以使用 NGC CLI 找到模型 ID。如需更多信息,请参阅 NGC CLI 参考。
-
您知道
帐户自定义资源(CR)的名称和命名空间。
流程
在一个终端窗口中,以集群管理员身份登录到 OpenShift CLI,如下例所示:
oc login <openshift_cluster_url> -u <admin_username> -p <password>
oc login <openshift_cluster_url> -u <admin_username> -p <password>Copy to Clipboard Copied! Toggle word wrap Toggle overflow 在 YAML 文件中定义
ConfigMap对象,类似于以下示例中的 ConfigMap 对象,其中包含您要在 NVIDIA NIM 模型服务平台上选择的模型 ID:Copy to Clipboard Copied! Toggle word wrap Toggle overflow 确认
帐户 CR 的名称和命名空间:oc get account -A
oc get account -ACopy to Clipboard Copied! Toggle word wrap Toggle overflow 您会看到类似以下示例的输出:
NAMESPACE NAME TEMPLATE CONFIGMAP SECRET redhat-ods-applications odh-nim-account
NAMESPACE NAME TEMPLATE CONFIGMAP SECRET redhat-ods-applications odh-nim-accountCopy to Clipboard Copied! Toggle word wrap Toggle overflow 在与您的帐户 CR 相同的命名空间中部署
ConfigMap对象:oc apply -f <configmap-name> -n <namespace>
oc apply -f <configmap-name> -n <namespace>Copy to Clipboard Copied! Toggle word wrap Toggle overflow 将 <configmap-name > 替换为您的 YAML 文件的名称,将 & lt;namespace > 替换为您的
帐户CR 的命名空间。将之前创建的
ConfigMap对象添加到AccountCR 的spec.modelListConfig部分:oc patch account <account-name> \ --type='merge' \ -p '{"spec": {"modelListConfig": {"name": "<configmap-name>"}}}'oc patch account <account-name> \ --type='merge' \ -p '{"spec": {"modelListConfig": {"name": "<configmap-name>"}}}'Copy to Clipboard Copied! Toggle word wrap Toggle overflow 将 <account-name > 替换为
帐户CR 的名称,将 & lt;configmap-name& gt; 替换为您的ConfigMap对象。确认
ConfigMap对象已添加到您的帐户 CR中:oc get account <account-name> -o yaml
oc get account <account-name> -o yamlCopy to Clipboard Copied! Toggle word wrap Toggle overflow 您可以在
AccountCR 的spec.modelListConfig部分看到ConfigMap对象,类似于以下输出:spec: enabledModelsConfig: modelListConfig: name: <configmap-name>
spec: enabledModelsConfig: modelListConfig: name: <configmap-name>Copy to Clipboard Copied! Toggle word wrap Toggle overflow
验证
- 按照以下步骤部署模型,如在 NVIDIA NIM 模型服务平台上部署模型 中所述,以部署 NIM 模型。您会看到 Deploy model 对话框中的 NVIDIA NIM 列表显示您首选的模型列表,而不是 NGC 目录中所有可用的型号。