Chapitre 8. Observabilité
8.1. Mesures de l'administrateur
8.1.1. Mesures de l'administrateur sans serveur
Les métriques permettent aux administrateurs de cluster de surveiller les performances des composants du cluster OpenShift Serverless et des charges de travail.
Vous pouvez visualiser différentes métriques pour OpenShift Serverless en naviguant vers Dashboards dans la console web de OpenShift Container Platform Administrator perspective.
8.1.1.1. Conditions préalables
- Voir la documentation OpenShift Container Platform sur la gestion des métriques pour plus d'informations sur l'activation des métriques pour votre cluster.
- Vous avez accès à un compte OpenShift Container Platform avec un accès administrateur de cluster.
- Vous avez accès à la perspective Administrator dans la console web de OpenShift Container Platform.
Si Service Mesh est activé avec mTLS, les métriques pour Knative Serving sont désactivées par défaut car Service Mesh empêche Prometheus de récupérer les métriques.
Pour plus d'informations sur la résolution de ce problème, voir Activation des métriques Knative Serving lors de l'utilisation de Service Mesh avec mTLS.
Le scraping des métriques n'affecte pas l'autoscaling d'un service Knative, car les requêtes de scraping ne passent pas par l'activateur. Par conséquent, aucun scraping n'a lieu si aucun pod n'est en cours d'exécution.
8.1.2. Métriques des contrôleurs sans serveur
Les mesures suivantes sont émises par tout composant qui met en œuvre une logique de contrôleur. Ces mesures donnent des détails sur les opérations de rapprochement et sur le comportement de la file d'attente en fonction duquel les demandes de rapprochement sont ajoutées à la file d'attente.
Nom de la métrique | Description | Type | Tags | Unité |
---|---|---|---|---|
| La profondeur de la file d'attente. | Jauge |
| Entier (pas d'unité) |
| Le nombre d'opérations de rapprochement. | Compteur |
| Entier (pas d'unité) |
| Le temps de latence des opérations de rapprochement. | Histogramme |
| Millisecondes |
| Nombre total d'actions d'ajout traitées par la file d'attente. | Compteur |
| Entier (pas d'unité) |
| Durée pendant laquelle un élément reste dans la file d'attente avant d'être demandé. | Histogramme |
| Secondes |
| Le nombre total de tentatives qui ont été traitées par la file d'attente. | Compteur |
| Entier (pas d'unité) |
| Le temps nécessaire pour traiter un élément de la file d'attente. | Histogramme |
| Secondes |
| Durée pendant laquelle les éléments de la file d'attente en suspens sont en cours de traitement. | Histogramme |
| Secondes |
| Durée pendant laquelle les éléments de la file d'attente les plus anciens sont en cours de traitement. | Histogramme |
| Secondes |
8.1.3. Métriques des webhooks
Les métriques des webhooks fournissent des informations utiles sur les opérations. Par exemple, si un grand nombre d'opérations échouent, cela peut indiquer un problème avec une ressource créée par l'utilisateur.
Nom de la métrique | Description | Type | Tags | Unité |
---|---|---|---|---|
| Le nombre de requêtes acheminées vers le webhook. | Compteur |
| Entier (pas d'unité) |
| Le temps de réponse pour une demande de webhook. | Histogramme |
| Millisecondes |
8.1.4. Mesures du concours complet Knative
Les administrateurs de clusters peuvent afficher les mesures suivantes pour les composants Knative Eventing.
En agrégeant les mesures du code HTTP, les événements peuvent être séparés en deux catégories : les événements réussis (2xx) et les événements échoués (5xx).
8.1.4.1. Métriques d'entrée du courtier
Vous pouvez utiliser les mesures suivantes pour déboguer l'entrée du courtier, voir comment elle fonctionne et quels événements sont envoyés par le composant d'entrée.
Nom de la métrique | Description | Type | Tags | Unité |
---|---|---|---|---|
| Nombre d'événements reçus par un courtier. | Compteur |
| Entier (pas d'unité) |
| Temps nécessaire pour envoyer un événement à un canal. | Histogramme |
| Millisecondes |
8.1.4.2. Métriques de filtrage du courtier
Vous pouvez utiliser les mesures suivantes pour déboguer les filtres du courtier, voir comment ils fonctionnent et quels événements sont distribués par les filtres. Vous pouvez également mesurer la latence de l'action de filtrage sur un événement.
Nom de la métrique | Description | Type | Tags | Unité |
---|---|---|---|---|
| Nombre d'événements reçus par un courtier. | Compteur |
| Entier (pas d'unité) |
| Temps nécessaire pour envoyer un événement à un canal. | Histogramme |
| Millisecondes |
| Temps nécessaire au traitement d'un événement avant qu'il ne soit envoyé à un abonné au déclencheur. | Histogramme |
| Millisecondes |
8.1.4.3. Métriques du répartiteur InMemoryChannel
Vous pouvez utiliser les mesures suivantes pour déboguer les canaux InMemoryChannel
, voir comment ils fonctionnent et quels événements sont envoyés par les canaux.
Nom de la métrique | Description | Type | Tags | Unité |
---|---|---|---|---|
|
Nombre d'événements envoyés par les canaux | Compteur |
| Entier (pas d'unité) |
|
Temps nécessaire pour envoyer un événement à partir d'un canal | Histogramme |
| Millisecondes |
8.1.4.4. Mesures des sources d'événements
Vous pouvez utiliser les mesures suivantes pour vérifier que les événements ont été transmis de la source d'événements au puits d'événements connecté.
Nom de la métrique | Description | Type | Tags | Unité |
---|---|---|---|---|
| Nombre d'événements envoyés par la source d'événements. | Compteur |
| Entier (pas d'unité) |
| Nombre d'événements renvoyés par la source d'événements après un premier échec. | Compteur |
| Entier (pas d'unité) |
8.1.5. Métriques de service Knative
Les administrateurs de clusters peuvent afficher les mesures suivantes pour les composants Knative Serving.
8.1.5.1. Mesures de l'activateur
Vous pouvez utiliser les mesures suivantes pour comprendre comment les applications réagissent lorsque le trafic passe par l'activateur.
Nom de la métrique | Description | Type | Tags | Unité |
---|---|---|---|---|
| Nombre de demandes simultanées acheminées vers l'activateur, ou nombre moyen de demandes simultanées sur une période donnée. | Jauge |
| Entier (pas d'unité) |
| Nombre de demandes acheminées vers l'activateur. Il s'agit des demandes qui ont été satisfaites par le gestionnaire de l'activateur. | Compteur |
| Entier (pas d'unité) |
| Le temps de réponse en millisecondes pour une requête acheminée et satisfaite. | Histogramme |
| Millisecondes |
8.1.5.2. Mesures de l'autoscaler
Le composant autoscaler expose un certain nombre de métriques liées au comportement de l'autoscaler pour chaque révision. Par exemple, à tout moment, vous pouvez surveiller le nombre ciblé de pods que l'autoscaler tente d'allouer pour un service, le nombre moyen de requêtes par seconde pendant la fenêtre stable, ou si l'autoscaler est en mode panique si vous utilisez le Knative pod autoscaler (KPA).
Nom de la métrique | Description | Type | Tags | Unité |
---|---|---|---|---|
| Le nombre de pods que l'autoscaler tente d'allouer pour un service. | Jauge |
| Entier (pas d'unité) |
| La capacité d'éclatement excédentaire servie sur la fenêtre stable. | Jauge |
| Entier (pas d'unité) |
| Le nombre moyen de requêtes pour chaque pod observé au cours de la fenêtre stable. | Jauge |
| Entier (pas d'unité) |
| Le nombre moyen de demandes pour chaque pod observé au cours de la fenêtre de panique. | Jauge |
| Entier (pas d'unité) |
| Nombre de demandes simultanées que l'autoscaler tente d'envoyer à chaque pod. | Jauge |
| Entier (pas d'unité) |
| Nombre moyen de requêtes par seconde pour chaque module observé au cours de la fenêtre stable. | Jauge |
| Entier (pas d'unité) |
| Le nombre moyen de requêtes par seconde pour chaque pod observé au cours de la fenêtre de panique. | Jauge |
| Entier (pas d'unité) |
| Le nombre de requêtes par seconde que l'autoscaler cible pour chaque pod. | Jauge |
| Entier (pas d'unité) |
|
Cette valeur est | Jauge |
| Entier (pas d'unité) |
| Le nombre de pods que l'autoscaler a demandé au cluster Kubernetes. | Jauge |
| Entier (pas d'unité) |
| Le nombre de pods qui sont alloués et qui sont actuellement prêts. | Jauge |
| Entier (pas d'unité) |
| Nombre de pods dont l'état n'est pas prêt. | Jauge |
| Entier (pas d'unité) |
| Le nombre de pods qui sont actuellement en attente. | Jauge |
| Entier (pas d'unité) |
| Le nombre de pods qui se terminent actuellement. | Jauge |
| Entier (pas d'unité) |
8.1.5.3. Mesures de la durée d'exécution de Go
Chaque processus du plan de contrôle de Knative Serving émet un certain nombre de statistiques de mémoire d'exécution Go(MemStats).
La balise name
pour chaque métrique est une balise vide.
Nom de la métrique | Description | Type | Tags | Unité |
---|---|---|---|---|
|
Nombre d'octets d'objets du tas alloués. Cette mesure est identique à | Jauge |
| Entier (pas d'unité) |
| Le nombre cumulé d'octets alloués aux objets du tas. | Jauge |
| Entier (pas d'unité) |
| Le nombre total d'octets de mémoire obtenu du système d'exploitation. | Jauge |
| Entier (pas d'unité) |
| Le nombre de recherches de pointeurs effectuées par le moteur d'exécution. | Jauge |
| Entier (pas d'unité) |
| Le nombre cumulé d'objets du tas alloués. | Jauge |
| Entier (pas d'unité) |
| Le nombre cumulé d'objets du tas qui ont été libérés. | Jauge |
| Entier (pas d'unité) |
| Nombre d'octets d'objets du tas alloués. | Jauge |
| Entier (pas d'unité) |
| Le nombre d'octets de la mémoire vive obtenu du système d'exploitation. | Jauge |
| Entier (pas d'unité) |
| Le nombre d'octets dans les travées inutilisées. | Jauge |
| Entier (pas d'unité) |
| Le nombre d'octets dans les travées qui sont actuellement en cours d'utilisation. | Jauge |
| Entier (pas d'unité) |
| Nombre d'octets de mémoire physique restitués au système d'exploitation. | Jauge |
| Entier (pas d'unité) |
| Nombre d'objets du tas alloués. | Jauge |
| Entier (pas d'unité) |
| Nombre d'octets de la pile en cours d'utilisation. | Jauge |
| Entier (pas d'unité) |
| Le nombre d'octets de la mémoire de pile obtenu du système d'exploitation. | Jauge |
| Entier (pas d'unité) |
|
Le nombre d'octets des structures | Jauge |
| Entier (pas d'unité) |
|
Le nombre d'octets de mémoire obtenus du système d'exploitation pour les structures | Jauge |
| Entier (pas d'unité) |
|
Le nombre d'octets des structures | Jauge |
| Entier (pas d'unité) |
|
Le nombre d'octets de mémoire obtenus du système d'exploitation pour les structures | Jauge |
| Entier (pas d'unité) |
| Le nombre d'octets de mémoire dans les tables de hachage des seaux de profilage. | Jauge |
| Entier (pas d'unité) |
| Nombre d'octets de mémoire dans les métadonnées du ramassage des ordures. | Jauge |
| Entier (pas d'unité) |
| Le nombre d'octets de mémoire dans les diverses allocations de durée d'exécution en dehors du tas. | Jauge |
| Entier (pas d'unité) |
| La taille du tas cible du prochain cycle de ramassage des ordures. | Jauge |
| Entier (pas d'unité) |
| Heure à laquelle le dernier ramassage des ordures s'est achevé ( Epoch ou heure Unix). | Jauge |
| Nanosecondes |
| Le temps cumulé des pauses du ramasse-miettes stop-the-world depuis le début du programme. | Jauge |
| Nanosecondes |
| Nombre de cycles de ramassage d'ordures terminés. | Jauge |
| Entier (pas d'unité) |
| Nombre de cycles de ramassage d'ordures forcés en raison de l'appel d'une application à la fonction de ramassage d'ordures. | Jauge |
| Entier (pas d'unité) |
| La fraction du temps CPU disponible du programme qui a été utilisée par le ramasse-miettes depuis le début du programme. | Jauge |
| Entier (pas d'unité) |