5.4. Fonctionnalités GPU NVIDIA pour OpenShift Dedicated
- Boîte à outils NVIDIA Container
- La boîte à outils NVIDIA Container vous permet de créer et d’exécuter des conteneurs accélérés par GPU. La boîte à outils comprend une bibliothèque d’exécution de conteneurs et des utilitaires pour configurer automatiquement les conteneurs pour utiliser les GPU NVIDIA.
- Entreprise NVIDIA AI
La NVIDIA AI Enterprise est une suite complète de logiciels d’analyse de données et d’IA optimisés, certifiés et pris en charge avec les systèmes certifiés NVIDIA.
La NVIDIA AI Enterprise prend en charge Red Hat OpenShift Dedicated. Les méthodes d’installation suivantes sont prises en charge:
- Dédié sur le métal nu ou VMware vSphere avec GPU Passthrough.
- Dédié sur VMware vSphere avec NVIDIA vGPU.
- Découverte de fonctionnalités GPU
Découverte de fonctionnalités GPU NVIDIA pour Kubernetes est un composant logiciel qui vous permet de générer automatiquement des étiquettes pour les GPU disponibles sur un nœud. GPU Feature Discovery utilise la découverte de fonctionnalités de nœud (NFD) pour effectuer cette étiquette.
Le Node Feature Discovery Operator (NFD) gère la découverte des fonctionnalités matérielles et des configurations dans un cluster OpenShift Container Platform en étiquetant des nœuds avec des informations spécifiques au matériel. Le NFD étiquete l’hôte avec des attributs spécifiques aux nœuds, tels que les cartes PCI, le noyau, la version OS, etc.
Il est possible de trouver l’opérateur NFD dans le hub opérateur en recherchant "Node Feature Discovery".
- Opérateur GPU NVIDIA avec virtualisation OpenShift
Jusqu’à présent, l’opérateur GPU n’a fourni que des nœuds de travail pour exécuter des conteneurs accélérés par GPU. Désormais, l’opérateur GPU peut également être utilisé pour fournir des nœuds de travail pour l’exécution de machines virtuelles accélérées par GPU (VM).
Il est possible de configurer l’opérateur GPU pour déployer différents composants logiciels sur les nœuds de travail en fonction de la charge de travail GPU configurée pour s’exécuter sur ces nœuds.
- GPU Surveillance du tableau de bord
- Il est possible d’installer un tableau de bord de surveillance pour afficher les informations d’utilisation du GPU sur la page Observer le cluster dans la console Web dédiée OpenShift. Les informations sur l’utilisation du GPU comprennent le nombre de GPU disponibles, la consommation d’énergie (en watts), la température (en degrés Celsius), l’utilisation (en pourcentage) et d’autres mesures pour chaque GPU.