9.3. Utiliser les ressources GPU NVIDIA avec des applications sans serveur
NVIDIA prend en charge l'utilisation des ressources GPU sur OpenShift Container Platform. Voir GPU Operator on OpenShift pour plus d'informations sur la configuration des ressources GPU sur OpenShift Container Platform.
9.3.1. Spécifier les exigences du GPU pour un service
Une fois les ressources GPU activées pour votre cluster OpenShift Container Platform, vous pouvez spécifier les exigences GPU pour un service Knative à l'aide de la CLI Knative (kn
).
Conditions préalables
- L'opérateur OpenShift Serverless, Knative Serving et Knative Eventing sont installés sur le cluster.
-
Vous avez installé le CLI Knative (
kn
). - Les ressources GPU sont activées pour votre cluster OpenShift Container Platform.
- Vous avez créé un projet ou avez accès à un projet avec les rôles et autorisations appropriés pour créer des applications et d'autres charges de travail dans OpenShift Container Platform.
L'utilisation des ressources GPU NVIDIA n'est pas prise en charge par IBM zSystems et IBM Power.
Procédure
Créez un service Knative et définissez la limite des ressources GPU requises à
1
en utilisant le drapeau--limit nvidia.com/gpu=1
:$ kn service create hello --image <service-image> --limit nvidia.com/gpu=1
Une limite de ressources GPU de
1
signifie que le service dispose d'une ressource GPU dédiée. Les services ne partagent pas les ressources GPU. Tout autre service nécessitant des ressources GPU doit attendre que la ressource GPU ne soit plus utilisée.Une limite de 1 GPU signifie également que les applications qui dépassent l'utilisation d'une ressource GPU sont restreintes. Si un service demande plus d'une ressource GPU, il est déployé sur un nœud où les besoins en ressources GPU peuvent être satisfaits.
Facultatif. Pour un service existant, vous pouvez modifier la limite des besoins en ressources GPU à
3
en utilisant l'indicateur--limit nvidia.com/gpu=3
:$ kn service update hello --limit nvidia.com/gpu=3