3.2. Redémarrage du cluster
Vous pouvez redémarrer votre cluster après qu'il ait été arrêté de manière gracieuse.
Conditions préalables
-
Vous avez accès au cluster en tant qu'utilisateur ayant le rôle
cluster-admin
. - Cette procédure suppose que vous avez arrêté le cluster de manière gracieuse.
Procédure
- Activez toutes les dépendances du cluster, telles que le stockage externe ou un serveur LDAP.
Démarrer toutes les machines du cluster.
Utilisez la méthode appropriée à votre environnement cloud pour démarrer les machines, par exemple à partir de la console web de votre fournisseur de cloud.
Attendez environ 10 minutes avant de continuer à vérifier l'état des nœuds du plan de contrôle.
Vérifier que tous les nœuds du plan de contrôle sont prêts.
oc get nodes -l node-role.kubernetes.io/master
$ oc get nodes -l node-role.kubernetes.io/master
Copy to Clipboard Copied! Toggle word wrap Toggle overflow Les nœuds du plan de contrôle sont prêts si l'état est
Ready
, comme le montre la sortie suivante :NAME STATUS ROLES AGE VERSION ip-10-0-168-251.ec2.internal Ready master 75m v1.25.0 ip-10-0-170-223.ec2.internal Ready master 75m v1.25.0 ip-10-0-211-16.ec2.internal Ready master 75m v1.25.0
NAME STATUS ROLES AGE VERSION ip-10-0-168-251.ec2.internal Ready master 75m v1.25.0 ip-10-0-170-223.ec2.internal Ready master 75m v1.25.0 ip-10-0-211-16.ec2.internal Ready master 75m v1.25.0
Copy to Clipboard Copied! Toggle word wrap Toggle overflow Si les nœuds du plan de contrôle sont prêts pour not, vérifiez s'il y a des demandes de signature de certificat (CSR) en attente qui doivent être approuvées.
Obtenir la liste des CSR actuels :
oc get csr
$ oc get csr
Copy to Clipboard Copied! Toggle word wrap Toggle overflow Examinez les détails d'un CSR pour vérifier qu'il est valide :
oc describe csr <csr_name>
oc describe csr <csr_name>
1 Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 1
<csr_name>
est le nom d'un CSR figurant dans la liste des CSR actuels.
Approuver chaque RSE valide :
oc adm certificate approve <csr_name>
$ oc adm certificate approve <csr_name>
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
Une fois que les nœuds du plan de contrôle sont prêts, vérifiez que tous les nœuds de travail sont prêts.
oc get nodes -l node-role.kubernetes.io/worker
$ oc get nodes -l node-role.kubernetes.io/worker
Copy to Clipboard Copied! Toggle word wrap Toggle overflow Les nœuds de travail sont prêts si le statut est
Ready
, comme le montre la sortie suivante :NAME STATUS ROLES AGE VERSION ip-10-0-179-95.ec2.internal Ready worker 64m v1.25.0 ip-10-0-182-134.ec2.internal Ready worker 64m v1.25.0 ip-10-0-250-100.ec2.internal Ready worker 64m v1.25.0
NAME STATUS ROLES AGE VERSION ip-10-0-179-95.ec2.internal Ready worker 64m v1.25.0 ip-10-0-182-134.ec2.internal Ready worker 64m v1.25.0 ip-10-0-250-100.ec2.internal Ready worker 64m v1.25.0
Copy to Clipboard Copied! Toggle word wrap Toggle overflow Si les nœuds de travail sont prêts pour not, vérifiez s'il y a des demandes de signature de certificat (CSR) en attente qui doivent être approuvées.
Obtenir la liste des CSR actuels :
oc get csr
$ oc get csr
Copy to Clipboard Copied! Toggle word wrap Toggle overflow Examinez les détails d'un CSR pour vérifier qu'il est valide :
oc describe csr <csr_name>
oc describe csr <csr_name>
1 Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 1
<csr_name>
est le nom d'un CSR figurant dans la liste des CSR actuels.
Approuver chaque RSE valide :
oc adm certificate approve <csr_name>
$ oc adm certificate approve <csr_name>
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
Vérifiez que le cluster a démarré correctement.
Vérifiez qu'il n'y a pas d'opérateurs de cluster dégradés.
oc get clusteroperators
$ oc get clusteroperators
Copy to Clipboard Copied! Toggle word wrap Toggle overflow Vérifiez qu'il n'y a pas d'opérateurs de cluster dont la condition
DEGRADED
est définie surTrue
.Copy to Clipboard Copied! Toggle word wrap Toggle overflow Vérifiez que tous les nœuds sont dans l'état
Ready
:oc get nodes
$ oc get nodes
Copy to Clipboard Copied! Toggle word wrap Toggle overflow Vérifiez que l'état de tous les nœuds est
Ready
.Copy to Clipboard Copied! Toggle word wrap Toggle overflow
Si le cluster n'a pas démarré correctement, il se peut que vous deviez le restaurer à l'aide d'une sauvegarde etcd.