17.9. Dépannage du gestionnaire de cycle de vie Topology Aware

17.9.1. Dépannage général
Copier lien

Vous pouvez déterminer la cause du problème en répondant aux questions suivantes :

La configuration que vous appliquez est-elle prise en charge ?
- Les versions du RHACM et de l'OpenShift Container Platform sont-elles compatibles ?
- Les versions du TALM et du RHACM sont-elles compatibles ?
Parmi les composants suivants, lequel est à l'origine du problème ?

Pour vous assurer que la configuration de ClusterGroupUpgrade est fonctionnelle, vous pouvez procéder comme suit :

Créez le CR ClusterGroupUpgrade avec le champ spec.enable défini sur false.
Attendez que le statut soit mis à jour et répondez aux questions de dépannage.
Si tout se passe comme prévu, réglez le champ spec.enable sur true dans le CR ClusterGroupUpgrade.

Avertissement

Après avoir attribué la valeur true au champ spec.enable dans la CR ClusterUpgradeGroup, la procédure de mise à jour commence et vous ne pouvez plus modifier les champs spec de la CR.

17.9.2. Impossible de modifier le CR ClusterUpgradeGroup
Copier lien

Enjeu

Vous ne pouvez pas modifier le CR ClusterUpgradeGroup après avoir activé la mise à jour.

Résolution

Relancez la procédure en procédant comme suit :

Supprimez l'ancien ClusterGroupUpgrade CR en exécutant la commande suivante :

oc delete cgu -n <ClusterGroupUpgradeCR_namespace> <ClusterGroupUpgradeCR_name>

$ oc delete cgu -n <ClusterGroupUpgradeCR_namespace> <ClusterGroupUpgradeCR_name>

Copy to Clipboard

Toggle word wrap

Vérifier et résoudre les problèmes existants avec les clusters et les politiques gérés.
1. Assurez-vous que tous les clusters sont gérés et disponibles.
2. Assurez-vous que toutes les politiques existent et que le champ spec.remediationAction est défini sur inform.
Créez un nouveau CR ClusterGroupUpgrade avec les configurations correctes.
```
oc apply -f <ClusterGroupUpgradeCR_YAML>
```
```
oc apply -f <ClusterGroupUpgradeCR_YAML>
```
Copy to Clipboard Toggle word wrap

17.9.3. Politiques gérées
Copier lien

Vérification des politiques gérées sur le système

Enjeu

Vous voulez vérifier si vous avez les bonnes stratégies gérées sur le système.

Résolution

Exécutez la commande suivante :

oc get cgu lab-upgrade -ojsonpath='{.spec.managedPolicies}'

$ oc get cgu lab-upgrade -ojsonpath='{.spec.managedPolicies}'

Copy to Clipboard

Toggle word wrap

Exemple de sortie

["group-du-sno-validator-du-validator-policy", "policy2-common-nto-sub-policy", "policy3-common-ptp-sub-policy"]

["group-du-sno-validator-du-validator-policy", "policy2-common-nto-sub-policy", "policy3-common-ptp-sub-policy"]

Copy to Clipboard

Toggle word wrap

Vérification du mode de remédiationAction

Enjeu

Vous voulez vérifier si le champ remediationAction est défini sur inform dans le spec des politiques gérées.

Résolution

Exécutez la commande suivante :

oc get policies --all-namespaces

$ oc get policies --all-namespaces

Copy to Clipboard

Toggle word wrap

Exemple de sortie

NAMESPACE   NAME                                                 REMEDIATION ACTION   COMPLIANCE STATE   AGE
default     policy1-common-cluster-version-policy                inform               NonCompliant       5d21h
default     policy2-common-nto-sub-policy                        inform               Compliant          5d21h
default     policy3-common-ptp-sub-policy                        inform               NonCompliant       5d21h
default     policy4-common-sriov-sub-policy                      inform               NonCompliant       5d21h

NAMESPACE   NAME                                                 REMEDIATION ACTION   COMPLIANCE STATE   AGE
default     policy1-common-cluster-version-policy                inform               NonCompliant       5d21h
default     policy2-common-nto-sub-policy                        inform               Compliant          5d21h
default     policy3-common-ptp-sub-policy                        inform               NonCompliant       5d21h
default     policy4-common-sriov-sub-policy                      inform               NonCompliant       5d21h

Copy to Clipboard

Toggle word wrap

Vérification de l'état de conformité de la politique

Enjeu

Vous souhaitez vérifier l'état de conformité des politiques.

Résolution

Exécutez la commande suivante :

oc get policies --all-namespaces

$ oc get policies --all-namespaces

Copy to Clipboard

Toggle word wrap

Exemple de sortie

NAMESPACE   NAME                                                 REMEDIATION ACTION   COMPLIANCE STATE   AGE
default     policy1-common-cluster-version-policy                inform               NonCompliant       5d21h
default     policy2-common-nto-sub-policy                        inform               Compliant          5d21h
default     policy3-common-ptp-sub-policy                        inform               NonCompliant       5d21h
default     policy4-common-sriov-sub-policy                      inform               NonCompliant       5d21h

NAMESPACE   NAME                                                 REMEDIATION ACTION   COMPLIANCE STATE   AGE
default     policy1-common-cluster-version-policy                inform               NonCompliant       5d21h
default     policy2-common-nto-sub-policy                        inform               Compliant          5d21h
default     policy3-common-ptp-sub-policy                        inform               NonCompliant       5d21h
default     policy4-common-sriov-sub-policy                      inform               NonCompliant       5d21h

Copy to Clipboard

Toggle word wrap

17.9.4. Clusters
Copier lien

Vérification de la présence de clusters gérés

Enjeu

Vous voulez vérifier si les clusters dans le CR ClusterGroupUpgrade sont des clusters gérés.

Résolution

Exécutez la commande suivante :

oc get managedclusters

$ oc get managedclusters

Copy to Clipboard

Toggle word wrap

Exemple de sortie

NAME            HUB ACCEPTED   MANAGED CLUSTER URLS                    JOINED   AVAILABLE   AGE
local-cluster   true           https://api.hub.example.com:6443        True     Unknown     13d
spoke1          true           https://api.spoke1.example.com:6443     True     True        13d
spoke3          true           https://api.spoke3.example.com:6443     True     True        27h

NAME            HUB ACCEPTED   MANAGED CLUSTER URLS                    JOINED   AVAILABLE   AGE
local-cluster   true           https://api.hub.example.com:6443        True     Unknown     13d
spoke1          true           https://api.spoke1.example.com:6443     True     True        13d
spoke3          true           https://api.spoke3.example.com:6443     True     True        27h

Copy to Clipboard

Toggle word wrap

Vous pouvez également consulter les journaux du gestionnaire TALM :

Obtenez le nom du gestionnaire TALM en exécutant la commande suivante :

oc get pod -n openshift-operators

$ oc get pod -n openshift-operators

Copy to Clipboard

Toggle word wrap

Exemple de sortie

NAME                                                         READY   STATUS    RESTARTS   AGE
cluster-group-upgrades-controller-manager-75bcc7484d-8k8xp   2/2     Running   0          45m

NAME                                                         READY   STATUS    RESTARTS   AGE
cluster-group-upgrades-controller-manager-75bcc7484d-8k8xp   2/2     Running   0          45m

Copy to Clipboard

Toggle word wrap

Vérifiez les journaux du gestionnaire TALM en exécutant la commande suivante :

oc logs -n openshift-operators \
cluster-group-upgrades-controller-manager-75bcc7484d-8k8xp -c manager

$ oc logs -n openshift-operators \
cluster-group-upgrades-controller-manager-75bcc7484d-8k8xp -c manager

Copy to Clipboard

Toggle word wrap

Exemple de sortie

ERROR	controller-runtime.manager.controller.clustergroupupgrade	Reconciler error	{"reconciler group": "ran.openshift.io", "reconciler kind": "ClusterGroupUpgrade", "name": "lab-upgrade", "namespace": "default", "error": "Cluster spoke5555 is not a ManagedCluster"} 
sigs.k8s.io/controller-runtime/pkg/internal/controller.(*Controller).processNextWorkItem

ERROR	controller-runtime.manager.controller.clustergroupupgrade	Reconciler error	{"reconciler group": "ran.openshift.io", "reconciler kind": "ClusterGroupUpgrade", "name": "lab-upgrade", "namespace": "default", "error": "Cluster spoke5555 is not a ManagedCluster"}

1


sigs.k8s.io/controller-runtime/pkg/internal/controller.(*Controller).processNextWorkItem

Copy to Clipboard

Toggle word wrap

1: Le message d'erreur indique que le cluster n'est pas un cluster géré.

Vérification de la disponibilité des clusters gérés

Enjeu

Vous voulez vérifier si les clusters gérés spécifiés dans le CR ClusterGroupUpgrade sont disponibles.

Résolution

Exécutez la commande suivante :

oc get managedclusters

$ oc get managedclusters

Copy to Clipboard

Toggle word wrap

Exemple de sortie

NAME            HUB ACCEPTED   MANAGED CLUSTER URLS                    JOINED   AVAILABLE   AGE
local-cluster   true           https://api.hub.testlab.com:6443        True     Unknown     13d
spoke1          true           https://api.spoke1.testlab.com:6443     True     True        13d 
spoke3          true           https://api.spoke3.testlab.com:6443     True     True        27h

NAME            HUB ACCEPTED   MANAGED CLUSTER URLS                    JOINED   AVAILABLE   AGE
local-cluster   true           https://api.hub.testlab.com:6443        True     Unknown     13d
spoke1          true           https://api.spoke1.testlab.com:6443     True     True        13d

1


spoke3          true           https://api.spoke3.testlab.com:6443     True     True        27h

2

Copy to Clipboard

Toggle word wrap

1 2: La valeur du champ AVAILABLE est True pour les clusters gérés.

Vérification du clusterLabelSelector

Enjeu

Vous voulez vérifier si le champ clusterLabelSelector spécifié dans le CR ClusterGroupUpgrade correspond à au moins un des clusters gérés.

Résolution

Exécutez la commande suivante :

oc get managedcluster --selector=upgrade=true

oc get managedcluster --selector=upgrade=true

1

Copy to Clipboard

Toggle word wrap

1: L'étiquette des clusters que vous souhaitez mettre à jour est upgrade:true.

Exemple de sortie

NAME            HUB ACCEPTED   MANAGED CLUSTER URLS                     JOINED    AVAILABLE   AGE
spoke1          true           https://api.spoke1.testlab.com:6443      True     True        13d
spoke3          true           https://api.spoke3.testlab.com:6443      True     True        27h

NAME            HUB ACCEPTED   MANAGED CLUSTER URLS                     JOINED    AVAILABLE   AGE
spoke1          true           https://api.spoke1.testlab.com:6443      True     True        13d
spoke3          true           https://api.spoke3.testlab.com:6443      True     True        27h

Copy to Clipboard

Toggle word wrap

Vérification de la présence de grappes de canaris

Enjeu

Vous voulez vérifier si les clusters canaris sont présents dans la liste des clusters.

Exemple ClusterGroupUpgrade CR

spec:
    remediationStrategy:
        canaries:
        - spoke3
        maxConcurrency: 2
        timeout: 240
    clusterLabelSelectors:
      - matchLabels:
          upgrade: true

spec:
    remediationStrategy:
        canaries:
        - spoke3
        maxConcurrency: 2
        timeout: 240
    clusterLabelSelectors:
      - matchLabels:
          upgrade: true

Copy to Clipboard

Toggle word wrap

Résolution

Exécutez les commandes suivantes :

oc get cgu lab-upgrade -ojsonpath='{.spec.clusters}'

$ oc get cgu lab-upgrade -ojsonpath='{.spec.clusters}'

Copy to Clipboard

Toggle word wrap

Exemple de sortie

["spoke1", "spoke3"]

["spoke1", "spoke3"]

Copy to Clipboard

Toggle word wrap

Vérifiez si les clusters canaris sont présents dans la liste des clusters qui correspondent aux étiquettes clusterLabelSelector en exécutant la commande suivante :

oc get managedcluster --selector=upgrade=true

$ oc get managedcluster --selector=upgrade=true

Copy to Clipboard

Toggle word wrap

Exemple de sortie

NAME            HUB ACCEPTED   MANAGED CLUSTER URLS   JOINED    AVAILABLE   AGE
spoke1          true           https://api.spoke1.testlab.com:6443   True     True        13d
spoke3          true           https://api.spoke3.testlab.com:6443   True     True        27h

NAME            HUB ACCEPTED   MANAGED CLUSTER URLS   JOINED    AVAILABLE   AGE
spoke1          true           https://api.spoke1.testlab.com:6443   True     True        13d
spoke3          true           https://api.spoke3.testlab.com:6443   True     True        27h

Copy to Clipboard

Toggle word wrap

Note

Un groupe peut être présent sur le site spec.clusters et correspondre à l'étiquette spec.clusterLabelSelector.

Vérification de l'état de la mise en cache sur les clusters de rayons

Vérifiez l'état de la mise en cache préalable en exécutant la commande suivante sur le cluster de rayons :
```
oc get jobs,pods -n openshift-talo-pre-cache
```
```
$ oc get jobs,pods -n openshift-talo-pre-cache
```
Copy to Clipboard Toggle word wrap

17.9.5. Stratégie d'assainissement
Copier lien

Vérification de la présence de remediationStrategy dans le CR ClusterGroupUpgrade

Enjeu

Vous voulez vérifier si le remediationStrategy est présent dans le ClusterGroupUpgrade CR.

Résolution

Exécutez la commande suivante :

oc get cgu lab-upgrade -ojsonpath='{.spec.remediationStrategy}'

$ oc get cgu lab-upgrade -ojsonpath='{.spec.remediationStrategy}'

Copy to Clipboard

Toggle word wrap

Exemple de sortie

{"maxConcurrency":2, "timeout":240}

{"maxConcurrency":2, "timeout":240}

Copy to Clipboard

Toggle word wrap

Vérification de la spécification de maxConcurrency dans le CR ClusterGroupUpgrade

Enjeu

Vous voulez vérifier si le maxConcurrency est spécifié dans le ClusterGroupUpgrade CR.

Résolution

Exécutez la commande suivante :

oc get cgu lab-upgrade -ojsonpath='{.spec.remediationStrategy.maxConcurrency}'

$ oc get cgu lab-upgrade -ojsonpath='{.spec.remediationStrategy.maxConcurrency}'

Copy to Clipboard

Toggle word wrap

Exemple de sortie

Copy to Clipboard

Toggle word wrap

17.9.6. Gestionnaire du cycle de vie tenant compte de la topologie
Copier lien

Vérification du message de condition et du statut dans le CR ClusterGroupUpgrade

Enjeu

Vous voulez vérifier la valeur du champ status.conditions dans le CR ClusterGroupUpgrade.

Résolution

Exécutez la commande suivante :

oc get cgu lab-upgrade -ojsonpath='{.status.conditions}'

$ oc get cgu lab-upgrade -ojsonpath='{.status.conditions}'

Copy to Clipboard

Toggle word wrap

Exemple de sortie

{"lastTransitionTime":"2022-02-17T22:25:28Z", "message":"Missing managed policies:[policyList]", "reason":"NotAllManagedPoliciesExist", "status":"False", "type":"Validated"}

{"lastTransitionTime":"2022-02-17T22:25:28Z", "message":"Missing managed policies:[policyList]", "reason":"NotAllManagedPoliciesExist", "status":"False", "type":"Validated"}

Copy to Clipboard

Toggle word wrap

Vérification des politiques copiées correspondantes

Enjeu

Vous voulez vérifier si chaque politique de status.managedPoliciesForUpgrade a une politique correspondante dans status.copiedPolicies.

Résolution

Exécutez la commande suivante :

oc get cgu lab-upgrade -oyaml

$ oc get cgu lab-upgrade -oyaml

Copy to Clipboard

Toggle word wrap

Exemple de sortie

status:
  …
  copiedPolicies:
  - lab-upgrade-policy3-common-ptp-sub-policy
  managedPoliciesForUpgrade:
  - name: policy3-common-ptp-sub-policy
    namespace: default

status:
  …
  copiedPolicies:
  - lab-upgrade-policy3-common-ptp-sub-policy
  managedPoliciesForUpgrade:
  - name: policy3-common-ptp-sub-policy
    namespace: default

Copy to Clipboard

Toggle word wrap

Vérifier si status.remediationPlan a été calculé

Enjeu

Vous voulez vérifier si status.remediationPlan est calculé.

Résolution

Exécutez la commande suivante :

oc get cgu lab-upgrade -ojsonpath='{.status.remediationPlan}'

$ oc get cgu lab-upgrade -ojsonpath='{.status.remediationPlan}'

Copy to Clipboard

Toggle word wrap

Exemple de sortie

[["spoke2", "spoke3"]]

[["spoke2", "spoke3"]]

Copy to Clipboard

Toggle word wrap

Erreurs dans le conteneur du gestionnaire TALM

Enjeu

Vous voulez vérifier les journaux du conteneur gestionnaire de TALM.

Résolution

Exécutez la commande suivante :

oc logs -n openshift-operators \
cluster-group-upgrades-controller-manager-75bcc7484d-8k8xp -c manager

$ oc logs -n openshift-operators \
cluster-group-upgrades-controller-manager-75bcc7484d-8k8xp -c manager

Copy to Clipboard

Toggle word wrap

Exemple de sortie

ERROR	controller-runtime.manager.controller.clustergroupupgrade	Reconciler error	{"reconciler group": "ran.openshift.io", "reconciler kind": "ClusterGroupUpgrade", "name": "lab-upgrade", "namespace": "default", "error": "Cluster spoke5555 is not a ManagedCluster"} 
sigs.k8s.io/controller-runtime/pkg/internal/controller.(*Controller).processNextWorkItem

ERROR	controller-runtime.manager.controller.clustergroupupgrade	Reconciler error	{"reconciler group": "ran.openshift.io", "reconciler kind": "ClusterGroupUpgrade", "name": "lab-upgrade", "namespace": "default", "error": "Cluster spoke5555 is not a ManagedCluster"}

1


sigs.k8s.io/controller-runtime/pkg/internal/controller.(*Controller).processNextWorkItem

Copy to Clipboard

Toggle word wrap

1: Affiche l'erreur.

Les clusters ne sont pas conformes à certaines politiques après l'achèvement d'une CR `ClusterGroupUpgrade`

Enjeu

L'état de conformité de la politique que TALM utilise pour décider si une remédiation est nécessaire n'a pas encore été complètement mis à jour pour tous les clusters. Cela peut s'expliquer par les raisons suivantes

L'UGT a été lancée trop tôt après la création ou la mise à jour d'une politique.
La remédiation d'une politique affecte la conformité des politiques suivantes dans le CR ClusterGroupUpgrade.

Résolution

Créez une nouvelle application ClusterGroupUpdate CR avec les mêmes spécifications.

17.9.1. Dépannage général
Copier lien

17.9.2. Impossible de modifier le CR ClusterUpgradeGroup
Copier lien

17.9.3. Politiques gérées
Copier lien

Vérification des politiques gérées sur le système

Vérification du mode de remédiationAction

Vérification de l'état de conformité de la politique

17.9.4. Clusters
Copier lien

Vérification de la présence de clusters gérés

Vérification de la disponibilité des clusters gérés

Vérification du clusterLabelSelector

Vérification de la présence de grappes de canaris

Vérification de l'état de la mise en cache sur les clusters de rayons

17.9.5. Stratégie d'assainissement
Copier lien

Vérification de la présence de remediationStrategy dans le CR ClusterGroupUpgrade

Vérification de la spécification de maxConcurrency dans le CR ClusterGroupUpgrade

17.9.6. Gestionnaire du cycle de vie tenant compte de la topologie
Copier lien

Vérification du message de condition et du statut dans le CR ClusterGroupUpgrade

Vérification des politiques copiées correspondantes

Vérifier si status.remediationPlan a été calculé

Erreurs dans le conteneur du gestionnaire TALM

Les clusters ne sont pas conformes à certaines politiques après l'achèvement d'une CR `ClusterGroupUpgrade`

Apprendre

Essayez, achetez et vendez

Communautés

À propos de la documentation Red Hat

Rendre l’open source plus inclusif

À propos de Red Hat

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

17.9. Dépannage du gestionnaire de cycle de vie Topology Aware

17.9.1. Dépannage généralCopier lienLien copié sur presse-papiers!

17.9.2. Impossible de modifier le CR ClusterUpgradeGroupCopier lienLien copié sur presse-papiers!

17.9.3. Politiques géréesCopier lienLien copié sur presse-papiers!

Vérification des politiques gérées sur le système

Vérification du mode de remédiationAction

Vérification de l'état de conformité de la politique

17.9.4. ClustersCopier lienLien copié sur presse-papiers!

Vérification de la présence de clusters gérés

Vérification de la disponibilité des clusters gérés

Vérification du clusterLabelSelector

Vérification de la présence de grappes de canaris

Vérification de l'état de la mise en cache sur les clusters de rayons

17.9.5. Stratégie d'assainissementCopier lienLien copié sur presse-papiers!

Vérification de la présence de remediationStrategy dans le CR ClusterGroupUpgrade

Vérification de la spécification de maxConcurrency dans le CR ClusterGroupUpgrade

17.9.6. Gestionnaire du cycle de vie tenant compte de la topologieCopier lienLien copié sur presse-papiers!

Vérification du message de condition et du statut dans le CR ClusterGroupUpgrade

Vérification des politiques copiées correspondantes

Vérifier si status.remediationPlan a été calculé

Erreurs dans le conteneur du gestionnaire TALM

Les clusters ne sont pas conformes à certaines politiques après l'achèvement d'une CR ClusterGroupUpgrade

Apprendre

Essayez, achetez et vendez

Communautés

À propos de la documentation Red Hat

Rendre l’open source plus inclusif

À propos de Red Hat

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links

17.9.1. Dépannage général
Copier lien

17.9.2. Impossible de modifier le CR ClusterUpgradeGroup
Copier lien

17.9.3. Politiques gérées
Copier lien

17.9.4. Clusters
Copier lien

17.9.5. Stratégie d'assainissement
Copier lien

17.9.6. Gestionnaire du cycle de vie tenant compte de la topologie
Copier lien

Les clusters ne sont pas conformes à certaines politiques après l'achèvement d'une CR `ClusterGroupUpgrade`