Rechercher

13.3. Utilisation du tableau de bord d'administration du GPU NVIDIA

download PDF

Après avoir déployé le plugin NVIDIA GPU de l'OpenShift Console, connectez-vous à la console web de l'OpenShift Container Platform en utilisant vos identifiants de connexion pour accéder à la perspective Administrator.

Pour voir les changements, vous devez rafraîchir la console pour voir l'onglet GPUs sous Compute.

13.3.1. Visualisation de la vue d'ensemble du GPU de la grappe

Vous pouvez consulter l'état des GPU de votre cluster sur la page de présentation en sélectionnant Présentation dans la section Accueil.

La page Vue d'ensemble fournit des informations sur les GPU de la grappe, notamment :

  • Détails sur les fournisseurs de GPU
  • Statut des GPU
  • Utilisation de la grappe de GPU

13.3.2. Affichage du tableau de bord des GPU

Vous pouvez afficher le tableau de bord d'administration des GPU NVIDIA en sélectionnant GPU dans la section Compute de la console OpenShift.

Les graphiques du tableau de bord des GPU sont les suivants :

  • GPU utilization: Indique le ratio de temps pendant lequel le moteur graphique est actif et est basé sur la métrique DCGM_FI_PROF_GR_ENGINE_ACTIVE.
  • Memory utilization: Indique la mémoire utilisée par le GPU et est basée sur la métrique DCGM_FI_DEV_MEM_COPY_UTIL.
  • Encoder utilization: Indique le taux d'utilisation de l'encodeur vidéo et est basé sur la métrique DCGM_FI_DEV_ENC_UTIL.
  • Decoder utilization: Encoder utilization: Indique le taux d'utilisation du décodeur vidéo et est basé sur la métrique DCGM_FI_DEV_DEC_UTIL.
  • Power consumption: Indique la consommation moyenne d'énergie du GPU en watts et se base sur la métrique DCGM_FI_DEV_POWER_USAGE.
  • GPU temperature: Affiche la température actuelle du GPU et se base sur la métrique DCGM_FI_DEV_GPU_TEMP. Le maximum est fixé à 110, qui est un nombre empirique, car le nombre réel n'est pas exposé par le biais d'une métrique.
  • GPU clock speed: Indique la vitesse d'horloge moyenne utilisée par le GPU et est basée sur la métrique DCGM_FI_DEV_SM_CLOCK.
  • Memory clock speed: Indique la vitesse d'horloge moyenne utilisée par la mémoire et est basée sur la métrique DCGM_FI_DEV_MEM_CLOCK.

13.3.3. Visualisation des mesures du GPU

Vous pouvez visualiser les métriques des GPU en sélectionnant la métrique en bas de chaque GPU pour afficher la page des métriques.

Sur la page Métriques, vous pouvez

  • Spécifier un taux de rafraîchissement pour les métriques
  • Ajouter, exécuter, désactiver et supprimer des requêtes
  • Insérer des métriques
  • Réinitialiser l'affichage du zoom
Red Hat logoGithubRedditYoutubeTwitter

Apprendre

Essayez, achetez et vendez

Communautés

À propos de la documentation Red Hat

Nous aidons les utilisateurs de Red Hat à innover et à atteindre leurs objectifs grâce à nos produits et services avec un contenu auquel ils peuvent faire confiance.

Rendre l’open source plus inclusif

Red Hat s'engage à remplacer le langage problématique dans notre code, notre documentation et nos propriétés Web. Pour plus de détails, consultez leBlog Red Hat.

À propos de Red Hat

Nous proposons des solutions renforcées qui facilitent le travail des entreprises sur plusieurs plates-formes et environnements, du centre de données central à la périphérie du réseau.

© 2024 Red Hat, Inc.