1.18. 集群状态从离线变为可用的故障排除
在没有对环境或集群进行任何手工更改的情况下,受管集群的状态在 offline(离线)
和 available(可用)
间转换。
1.18.1. 症状:集群状态从离线变为可用
当将受管集群连接到 hub 集群的网络不稳定时,hub 集群所报告的受管集群的状态在离线
和可用
之间不断转换。
hub 集群和受管集群之间的连接通过租期维护,该租期在 leaseDurationSeconds
间隔值验证。如果租期没有在 leaseDurationSeconds
值的五个连续尝试中验证,则集群被标记为 offline
。
例如,集群在五分钟后标记为 离线
,其中 leaseDurationSeconds
间隔为 60 秒
。由于连接问题或延迟等原因,此配置可能不足,从而导致不稳定。
1.18.2. 解决问题: 集群状态从离线变为可用
五个验证尝试是默认设置且无法更改,但您可以更改 leaseDurationSeconds
间隔。
确定您希望集群标记为 离线
的时间(以分钟为单位),然后将该值乘以 60 以转换为秒。然后,按默认的五次尝试次数划分。结果是您的 leaseDurationSeconds
值。
输入以下命令在 hub 集群上编辑
ManagedCluster
规格,但将cluster-name
替换为受管集群的名称:oc edit managedcluster <cluster-name>
在
ManagedCluster
规格中增加leaseDurationSeconds
的值,如下例所示:apiVersion: cluster.open-cluster-management.io/v1 kind: ManagedCluster metadata: name: <cluster-name> spec: hubAcceptsClient: true leaseDurationSeconds: 60
- 保存并应用该文件。