1.4. Résolution des problèmes
Un administrateur de cluster peut surveiller et dépanner les problèmes suivants liés aux composants d'OpenShift Container Platform :
Problèmes d'installation: L'installation d'OpenShift Container Platform se déroule en plusieurs étapes. Vous pouvez effectuer les opérations suivantes :
- Contrôler les étapes de l'installation.
- Déterminer à quel stade les problèmes d'installation surviennent.
- Examiner les problèmes liés à l'installation multiple.
- Rassembler les journaux d'une installation qui a échoué.
Problèmes liés aux nœuds : Un administrateur de cluster peut vérifier et dépanner les problèmes liés aux nœuds en examinant l'état, l'utilisation des ressources et la configuration d'un nœud. Vous pouvez interroger les éléments suivants :
- Statut du Kubelet sur un nœud.
- Journaux des nœuds de cluster.
Problèmes liés à Crio: Un administrateur de cluster peut vérifier l'état du moteur d'exécution des conteneurs CRI-O sur chaque nœud du cluster. Si vous rencontrez des problèmes d'exécution de conteneurs, procédez comme suit :
- Rassembler les journaux des unités du CRI-O.
- Nettoyage de l'entrepôt CRI-O.
Problèmes liés au système d'exploitation: OpenShift Container Platform fonctionne sous Red Hat Enterprise Linux CoreOS. Si vous rencontrez des problèmes liés au système d'exploitation, vous pouvez étudier les procédures de crash du noyau. Assurez-vous de ce qui suit :
- Activer kdump.
- Testez la configuration de kdump.
- Analyser un core dump.
Problèmes de réseau: Pour résoudre les problèmes liés à l'Open vSwitch, un administrateur de cluster peut effectuer les opérations suivantes :
- Configurez temporairement le niveau de log d'Open vSwitch.
- Configurer le niveau de log d'Open vSwitch de manière permanente.
- Afficher les journaux d'Open vSwitch.
Problèmes liés à l'opérateur: Un administrateur de cluster peut procéder comme suit pour résoudre les problèmes de l'opérateur :
- Vérifier l'état de l'abonnement de l'opérateur.
- Vérifier l'état de santé de la capsule de l'opérateur.
- Rassembler les registres de l'opérateur.
Problèmes liés aux modules : Un administrateur de cluster peut résoudre les problèmes liés aux pods en examinant l'état d'un pod et en effectuant les opérations suivantes :
- Examiner les journaux des cosses et des conteneurs.
- Démarrer les pods de débogage avec un accès root.
Problèmes source-image: Un administrateur de cluster peut observer les étapes du processus S2I pour déterminer à quel moment du processus S2I une défaillance s'est produite. Rassemblez les éléments suivants pour résoudre les problèmes Source-to-Image (S2I) :
- Données de diagnostic source-image.
- Données de diagnostic de l'application permettant d'enquêter sur les défaillances de l'application.
Problèmes de stockage: Une erreur de stockage multi-attaches se produit lorsque le montage d'un volume sur un nouveau nœud n'est pas possible parce que le nœud défaillant ne peut pas démonter le volume attaché. Un administrateur de cluster peut procéder comme suit pour résoudre les problèmes de stockage multi-attaches :
- Permettre des pièces jointes multiples en utilisant des volumes RWX.
- Récupérer ou supprimer le nœud défaillant lors de l'utilisation d'un volume RWO.
Problèmes de surveillance: Un administrateur de cluster peut suivre les procédures de la page de dépannage pour la surveillance. Si les métriques de vos projets définis par l'utilisateur ne sont pas disponibles ou si Prometheus consomme beaucoup d'espace disque, vérifiez les points suivants :
- Cherchez à savoir pourquoi les mesures définies par l'utilisateur ne sont pas disponibles.
- Déterminer pourquoi Prometheus consomme beaucoup d'espace disque.
Problèmes de journalisation: Un administrateur de cluster peut suivre les procédures de la page de dépannage pour les problèmes de journalisation d'OpenShift. Vérifiez les points suivants pour résoudre les problèmes de journalisation :
- Problèmes liés à OpenShift CLI (oc) : Examinez les problèmes liés à OpenShift CLI (oc) en augmentant le niveau de journalisation.