13.3. Utilisation du tableau de bord d'administration du GPU NVIDIA
Après avoir déployé le plugin NVIDIA GPU de l'OpenShift Console, connectez-vous à la console web de l'OpenShift Container Platform en utilisant vos identifiants de connexion pour accéder à la perspective Administrator.
Pour voir les changements, vous devez rafraîchir la console pour voir l'onglet GPUs sous Compute.
13.3.1. Visualisation de la vue d'ensemble du GPU de la grappe
Vous pouvez consulter l'état des GPU de votre cluster sur la page de présentation en sélectionnant Présentation dans la section Accueil.
La page Vue d'ensemble fournit des informations sur les GPU de la grappe, notamment :
- Détails sur les fournisseurs de GPU
- Statut des GPU
- Utilisation de la grappe de GPU
13.3.2. Affichage du tableau de bord des GPU
Vous pouvez afficher le tableau de bord d'administration des GPU NVIDIA en sélectionnant GPU dans la section Compute de la console OpenShift.
Les graphiques du tableau de bord des GPU sont les suivants :
-
GPU utilization: Indique le ratio de temps pendant lequel le moteur graphique est actif et est basé sur la métrique
DCGM_FI_PROF_GR_ENGINE_ACTIVE
. -
Memory utilization: Indique la mémoire utilisée par le GPU et est basée sur la métrique
DCGM_FI_DEV_MEM_COPY_UTIL
. -
Encoder utilization: Indique le taux d'utilisation de l'encodeur vidéo et est basé sur la métrique
DCGM_FI_DEV_ENC_UTIL
. -
Decoder utilization: Encoder utilization: Indique le taux d'utilisation du décodeur vidéo et est basé sur la métrique
DCGM_FI_DEV_DEC_UTIL
. -
Power consumption: Indique la consommation moyenne d'énergie du GPU en watts et se base sur la métrique
DCGM_FI_DEV_POWER_USAGE
. -
GPU temperature: Affiche la température actuelle du GPU et se base sur la métrique
DCGM_FI_DEV_GPU_TEMP
. Le maximum est fixé à110
, qui est un nombre empirique, car le nombre réel n'est pas exposé par le biais d'une métrique. -
GPU clock speed: Indique la vitesse d'horloge moyenne utilisée par le GPU et est basée sur la métrique
DCGM_FI_DEV_SM_CLOCK
. -
Memory clock speed: Indique la vitesse d'horloge moyenne utilisée par la mémoire et est basée sur la métrique
DCGM_FI_DEV_MEM_CLOCK
.
13.3.3. Visualisation des mesures du GPU
Vous pouvez visualiser les métriques des GPU en sélectionnant la métrique en bas de chaque GPU pour afficher la page des métriques.
Sur la page Métriques, vous pouvez
- Spécifier un taux de rafraîchissement pour les métriques
- Ajouter, exécuter, désactiver et supprimer des requêtes
- Insérer des métriques
- Réinitialiser l'affichage du zoom