12.2. 使用无服务器应用程序的 NVIDIA GPU 资源

NVIDIA 支持在 OpenShift Container Platform 上试验性地使用 GPU 资源。如需在OpenShift Container Platform 上设置 GPU 资源的更多信息，请参阅 NVIDIA GPU 加速集群上的 OpenShift Container Platform 。

12.2.1. 为服务指定 GPU 要求

为 OpenShift Container Platform 集群启用 GPU 资源后，您可以使用 Knative(kn)CLI 为 Knative 服务指定 GPU 要求。

先决条件

在集群中安装了 OpenShift Serverless Operator、Knative Serving 和 Knative Eventing。
已安装 Knative(kn)CLI。
为 OpenShift Container Platform 集群启用 GPU 资源。
您已创建了一个项目，或者具有适当的角色和权限访问项目，以便在 OpenShift Container Platform 中创建应用程序和其他工作负载。

注意

IBM Z 和 IBM Power Systems 不支持使用 NVIDIA GPU 资源。

流程

创建 Knative 服务并使用 --limit nvidia.com/gpu=1 标志将 GPU 资源要求限制设置为 1：
```
$ kn service create hello --image <service-image> --limit nvidia.com/gpu=1
```
GPU 资源要求限制为 1 表示该服务有 1 个专用的 GPU 资源。服务不共享 GPU 资源。所有需要 GPU 资源的其他服务都必须等待 GPU 资源不再被使用为止。
限值为 1 个 GPU 意味着超过使用 1 个 GPU 资源的应用程序会受到限制。如果服务请求超过 1 个 GPU 资源，它将部署到可以满足 GPU 资源要求的节点。
可选。对于现有服务，您可以使用 --limit nvidia.com/gpu=3 标志将 GPU 资源要求限制改为 3：
```
$ kn service update hello --limit nvidia.com/gpu=3
```

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务，以及可以信赖的内容，帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情，请参阅红帽博客.

關於紅帽

我们提供强化的解决方案，使企业能够更轻松地跨平台和环境（从核心数据中心到网络边缘）工作。

© 2024 Red Hat, Inc.