第 10 章 为实例配置虚拟 GPU
要支持实例上基于 GPU 的渲染,您可以根据可用的物理 GPU 设备和 hypervisor 类型定义和管理虚拟 GPU (vGPU)资源。您可以使用此配置更有效地在所有物理 GPU 设备之间划分渲染工作负载,并更好地控制启用了 vGPU 的实例。
要在 Compute (nova)服务中启用 vGPU,请创建类别,您的云用户可以使用 vGPU 设备创建 Red Hat Enterprise Linux (RHEL)实例。然后,每个实例都可以支持 GPU 工作负载,其虚拟 GPU 设备对应于物理 GPU 设备。
Compute 服务跟踪您在每个主机中定义的每个 GPU 配置集可用的 vGPU 设备数量。计算服务根据类别将实例调度到这些主机,连接设备,并持续监控使用情况。删除实例时,计算服务会将 vGPU 设备重新添加到可用池中。
红帽启用了在 RHOSP 中使用 NVIDIA vGPU,而无需支持例外。但是,红帽不为 NVIDIA vGPU 驱动程序提供技术支持。NVIDIA vGPU 驱动程序由 NVIDIA 提供并支持。您需要 NVIDIA 认证支持服务订阅来获得 NVIDIA Enterprise Support for NVIDIA vGPU 软件的支持。对于使用 NVIDIA vGPU 的问题,当您无法在支持的组件中重现问题,请应用以下支持策略:
- 当红帽不怀疑涉及第三方组件时,会应用正常的 支持范围 和 Red Hat SLA。
- 当红帽怀疑涉及第三方组件的问题时,客户将被定向到 NVIDIA,与红帽 第三方支持和认证政策一致。如需更多信息,请参阅知识库文章 从 NVIDIA 获得支持。
10.1. 支持的配置和限制 复制链接链接已复制到粘贴板!
支持的 GPU 卡
有关支持的 NVIDIA GPU 卡列表,请参阅 NVIDIA 网站上的 虚拟 GPU 软件支持的产品。
使用 vGPU 设备时的限制
- 每个实例只能使用一个 vGPU 资源。
- 不支持在主机之间实时迁移 vGPU 实例。
- 不支持 vGPU 实例撤离。
如果您需要重新引导托管 vGPU 实例的 Compute 节点,则 vGPU 不会自动重新分配给重新创建的实例。您必须在重启 Compute 节点前冷迁移实例,或者在重启后手动将每个 vGPU 分配给正确的实例。要手动分配每个 vGPU,您必须在重启前从 Compute 节点上运行的每个 vGPU 实例从实例 XML 检索
mdevUUID。您可以使用以下命令之一发现每个实例的mdevUUID:对于 RHEL 版本 8.4 Compute 节点:
sudo podman exec -it nova_libvirt virsh dumpxml <instance_name> | grep mdev
$ sudo podman exec -it nova_libvirt virsh dumpxml <instance_name> | grep mdevCopy to Clipboard Copied! Toggle word wrap Toggle overflow 对于 RHEL 版本 9.2 Compute 节点:
sudo podman exec -it nova_virtqemud virsh dumpxml <instance_name> | grep mdev
$ sudo podman exec -it nova_virtqemud virsh dumpxml <instance_name> | grep mdevCopy to Clipboard Copied! Toggle word wrap Toggle overflow 将
<instance_name> 替换为 libvirt 实例名称OS-EXT-SRV-ATTR:instance_name,在/servers请求中返回到 Compute API。
- 由于 libvirt 限制,不支持在支持 vGPU 的实例上暂停操作。相反,您可以对实例进行快照或清空。
- 默认情况下,Compute 主机上的 vGPU 类型不会向 API 用户公开。要将 Compute 主机上的 vGPU 类型公开给 API 用户,您必须配置资源供应商特征并创建需要特征的类别。如需更多信息,请参阅 创建自定义 vGPU 资源供应商特征。或者,如果您只有一个 vGPU 类型,您可以通过将主机添加到主机聚合来授予访问权限。如需更多信息,请参阅创建和管理主机聚合。
- 如果使用 NVIDIA 加速器硬件,您必须符合 NVIDIA 许可要求。例如: NVIDIA vGPU GRID 需要许可服务器。有关 NVIDIA 许可要求的更多信息,请参阅 NVIDIA 网站上的 NVIDIA License Server 发行注记。