9.5. 了解 EgressIP 故障转移控制
reachabilityTotalTimeoutSeconds 参数控制系统检测失败的 egressIP 节点并启动故障转移的速度。此参数直接决定平台在声明节点无法访问前需要等待的时间。
当您使用多个出口节点配置 egressIP 时,在新节点中恢复的完整故障切换时间会为几秒或更长时间。这是因为,在没有成功检查的情况下,新的 IP 分配只能在经过了 reachabilityTotalTimeoutSeconds 期限之后才开始。
为确保流量使用正确的外部路径,节点上的 egressIP 流量需要始终通过 egressIP 分配的地址的网络接口进行出口。
9.5.1. 配置 EgressIP 故障转移时间限制 复制链接链接已复制到粘贴板!
按照以下步骤配置 reachabilityTotalTimeoutSeconds 参数,它控制系统检测失败的 egressIP 节点并启动故障转移的速度。
先决条件
-
安装 OpenShift CLI(
oc)。 - 以集群管理员身份登录集群。
流程
运行以下命令来编辑
Network自定义资源:$ oc edit network.operator cluster-
进入
spec:defaultNetwork:ovnKubernetesConfig下的egressIPConfig: {}部分: 使用您选择的值修改块,使其包含
reachabilityTotalTimeoutSeconds参数,例如 5 秒。确保使用正确的缩进:defaultNetwork: ovnKubernetesConfig: egressIPConfig: reachabilityTotalTimeoutSeconds: 5注意该值必须是 0 到 60 之间的一个整数。有关可能值的详情,请查看"EgressIP 故障转移设置"部分。
- 保存并退出编辑器。Operator 会自动应用更改。
验证
运行以下命令验证系统是否已正确接受了
reachabilityTotalTimeoutSeconds参数:$ oc get network.operator cluster -o yaml检查输出,并确认
reachabilityTotalTimeoutSeconds参数是否在spec:defaultNetwork:ovnKubernetesConfig:egressIPConfig:值下正确嵌套:# ... spec: # ... defaultNetwork: ovnKubernetesConfig: egressIPConfig: reachabilityTotalTimeoutSeconds: 5 gatewayConfig: # ...
9.5.2. EgressIP 故障转移设置 复制链接链接已复制到粘贴板!
reachabilityTotalTimeoutSeconds 参数定义在声明节点前平台健康检查过程的总时间限制(以秒为单位)。
下表总结了可接受的值及其影响:
| 参数值 (秒) | 对可访问性检查的影响 | 故障转移影响和使用案例 |
|---|---|---|
|
| 禁用可访问性检查。 | 无自动故障转移 :只有在外部系统处理节点健康监控和故障转移时才使用。平台不会自动响应节点故障。 |
|
| 设置可访问性监测的总时间限制。 | 直接控制检测时间:这个值定义了整个故障切换时间的下限。较小的值会导致故障转移速度更快,但可能会增加网络流量。默认:1 秒。可接受的最大整数值为 60。 |