4.4. 恢复一个休眠集群


当您在 90 天内恢复休眠集群时,您可能需要批准证书签名请求(CSR)以使节点就绪。

根据集群的大小,集群可能需要大约 45 分钟才能恢复。

先决条件

  • 您在 90 天内休眠集群。
  • 您可以使用具有 cluster-admin 角色的用户访问集群。

流程

  1. 在集群休眠的 90 天内恢复集群虚拟机:

    使用集群云环境原生的工具来恢复集群的虚拟机。

  2. 具体取决于集群中的节点数量,等待大约 5 分钟。
  3. 批准节点的 CSR:

    1. 检查每个节点是否处于 NotReady 状态的 CSR:

      $ oc get csr
      Copy to Clipboard Toggle word wrap

      输出示例

      NAME       AGE  SIGNERNAME                                   REQUESTOR                                                                  REQUESTEDDURATION  CONDITION
      csr-4dwsd  37m  kubernetes.io/kube-apiserver-client          system:node:ci-ln-812tb4k-72292-8bcj7-worker-c-q8mw2                       24h                Pending
      csr-4vrbr  49m  kubernetes.io/kube-apiserver-client          system:node:ci-ln-812tb4k-72292-8bcj7-master-1                             24h                Pending
      csr-4wk5x  51m  kubernetes.io/kubelet-serving                system:node:ci-ln-812tb4k-72292-8bcj7-master-1                             <none>             Pending
      csr-84vb6  51m  kubernetes.io/kube-apiserver-client-kubelet  system:serviceaccount:openshift-machine-config-operator:node-bootstrapper  <none>             Pending
      Copy to Clipboard Toggle word wrap

    2. 运行以下命令来批准每个有效的 CSR:

      $ oc adm certificate approve <csr_name>
      Copy to Clipboard Toggle word wrap
    3. 运行以下命令验证所有必需的 CSR 是否已批准:

      $ oc get csr
      Copy to Clipboard Toggle word wrap

      输出示例

      NAME       AGE  SIGNERNAME                                   REQUESTOR                                                                  REQUESTEDDURATION  CONDITION
      csr-4dwsd  37m  kubernetes.io/kube-apiserver-client          system:node:ci-ln-812tb4k-72292-8bcj7-worker-c-q8mw2                       24h                Approved,Issued
      csr-4vrbr  49m  kubernetes.io/kube-apiserver-client          system:node:ci-ln-812tb4k-72292-8bcj7-master-1                             24h                Approved,Issued
      csr-4wk5x  51m  kubernetes.io/kubelet-serving                system:node:ci-ln-812tb4k-72292-8bcj7-master-1                             <none>             Approved,Issued
      csr-84vb6  51m  kubernetes.io/kube-apiserver-client-kubelet  system:serviceaccount:openshift-machine-config-operator:node-bootstrapper  <none>             Approved,Issued
      Copy to Clipboard Toggle word wrap

      CSR 应该在 CONDITION 列中显示为 Approved,Issued

  4. 运行以下命令验证所有节点现在显示为 ready :

    $ oc get nodes
    Copy to Clipboard Toggle word wrap

    输出示例

    NAME                                      STATUS  ROLES                 AGE   VERSION
    ci-ln-812tb4k-72292-8bcj7-master-0        Ready	  control-plane,master  32m   v1.32.3
    ci-ln-812tb4k-72292-8bcj7-master-1        Ready	  control-plane,master  32m   v1.32.3
    ci-ln-812tb4k-72292-8bcj7-master-2        Ready	  control-plane,master  32m   v1.32.3
    Ci-ln-812tb4k-72292-8bcj7-worker-a-zhdvk  Ready	  worker                19m   v1.32.3
    ci-ln-812tb4k-72292-8bcj7-worker-b-9hrmv  Ready	  worker                19m   v1.32.3
    ci-ln-812tb4k-72292-8bcj7-worker-c-q8mw2  Ready	  worker                19m   v1.32.3
    Copy to Clipboard Toggle word wrap

    所有节点的 STATUS 列都应显示 Ready。批准 CSR 后,所有节点可能需要几分钟时间才会变为就绪。

  5. 等待集群 Operator 重启以加载新证书。

    这可能需要 5 分钟或 10 分钟。

  6. 运行以下命令,验证所有集群 Operator 是否都处于良好状态:

    $ oc get clusteroperators
    Copy to Clipboard Toggle word wrap

    输出示例

    NAME                      VERSION   AVAILABLE  PROGRESSING  DEGRADED  SINCE   MESSAGE
    authentication            4.19.0-0  True       False        False     51m
    baremetal                 4.19.0-0  True       False        False     72m
    cloud-controller-manager  4.19.0-0  True       False        False     75m
    cloud-credential          4.19.0-0  True       False        False     77m
    cluster-api               4.19.0-0  True       False        False     42m
    cluster-autoscaler        4.19.0-0  True       False        False     72m
    config-operator           4.19.0-0  True       False        False     72m
    console                   4.19.0-0  True       False        False     55m
    ...
    Copy to Clipboard Toggle word wrap

    所有集群 Operator 都应显示 AVAILABLE=True,PROGRESSING=False, 和 DEGRADED=False

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat