1.15. 集群状态从离线变为可用的故障排除
在没有对环境或集群进行任何手工更改的情况下,受管集群的状态在 offline(离线)
和 available(可用)
间转换。
1.15.1. 症状:集群状态从离线变为可用
当将受管集群连接到 hub 集群的网络不稳定时,hub 集群所报告的受管集群的状态在离线
和可用
之间不断转换。
hub 集群和受管集群之间的连接通过 leaseDurationSeconds
interval 值验证的租期进行维护。如果在 leaseDurationSeconds
的值的五次尝试中未验证租期,则集群被标记为 离线
。
例如,在五分钟后集群标记为 离线
,leaseDurationSeconds
间隔为 60 秒
。由于连接问题或延迟等原因,此配置可能不足,从而导致不稳定。
1.15.2. 解决问题: 集群状态从离线变为可用
五个验证尝试是默认的,且无法更改,但您可以更改 leaseDurationSeconds
间隔。
确定您希望集群标记为 离线
的时间(以分钟为单位),然后将该值乘以 60 以转换为秒。然后默认划分五个尝试。结果为您的 leaseDurationSeconds
值。
输入以下命令编辑 hub 集群上的
ManagedCluster
规格,但将cluster-name
替换为受管集群的名称:oc edit managedcluster <cluster-name>
在
ManagedCluster
规格中增加leaseDurationSeconds
的值,如下例所示:apiVersion: cluster.open-cluster-management.io/v1 kind: ManagedCluster metadata: name: <cluster-name> spec: hubAcceptsClient: true leaseDurationSeconds: 60
- 保存并应用该文件。