4.11. 高可用性和集群
在 Podman 容器中管理 etcd 的新资源代理可用
在此次更新之前,Red Hat High Availability 不提供用于管理 Podman 容器中运行的 etcd 的资源代理。
在这个版本中,添加了新的 podman-etcd 资源代理。
因此,您可以为 Podman 容器中运行的 etcd 创建和管理资源。这个代理是带有隔离(TNF)解决方案的两个节点 OpenShift 所需的组件。
Filesystem 资源代理支持 aznfs 文件系统类型
在此次更新之前,要管理集群中的 Azure Network File System 文件共享,您必须使用 fstype=nfs 配置 Filesystem 资源代理。这个方法不支持特定于 Azure 的功能,如 Transit 中的加密。
在这个版本中,Filesystem 资源代理支持 aznfs 作为文件系统类型。
因此,您可以在创建 Filesystem 资源时设置 fstype=aznfs 来管理 Azure Network File System 文件共享。这可启用对 Azure 特定功能的支持。请注意,这个功能需要在所有集群节点上安装 Microsoft 存储库中的 aznfs 客户端软件包。
Oracle Database 23ai 作为集群资源被支持
在此次更新之前,Oracle 数据库资源代理没有经过测试以用于 Oracle Database 23ai 版本。因此,在 Pacemaker 集群中,这个版本不被支持作为高可用性资源。
在这个版本中,现有 Oracle 资源代理已使用 Oracle 数据库 23ai 成功测试并验证。
因此,Pacemaker 支持管理 Oracle 数据库 23ai 实例,为这个版本启用全面测试的高可用性配置。
Jira:RHEL-85220[1]
fence_sbd 代理可以自动检测 SBD 设备
在此次更新之前,在配置 fence_sbd 资源时,您需要使用 devices 参数明确指定 SBD 设备路径。
在这个版本中,fence_sbd 代理现在可以从系统检索设备配置。
因此,如果您在创建 fence_sbd 资源时没有设置 devices 参数,代理会自动使用 /etc/sysconfig/sbd 文件中的 SBD_DEVICE 变量中指定的设备。
watchdog 设备列表提供更详细的信息
在此次更新之前,当列出可用的 watchdog 设备时,输出仅显示设备路径,如 /dev/watchdog0。这使得管理员难以区分同一系统上的多个设备。
在这个版本中,输出包括每个 watchdog 的设备路径、身份和驱动程序。这允许轻松识别并选择正确的设备。
pcs 在删除最后一个隔离设备前警告用户
在此次更新之前,pcs allowed users to disable or remove the last fence device from a cluster, without a warning.这可能会意外地使集群处于不受支持的状态,而无需配置任何 STONITH 或 SBD 隔离。
有了这个增强,pcs 现在包含一个安全检查,以防止意外删除所有隔离机制。
因此,如果您试图使集群没有隔离,pcs 会显示一个错误并默认阻止更改。例如,当您尝试在禁用 SBD 时删除最后一个 STONITH 资源时会出现这种情况。如果需要,您可以覆盖此安全检查来强制更改。
pcs node 属性和 pcs node utilization 命令现在支持多种输出格式
在以前的版本中,pcs node 属性和 pcs node utilization 命令仅以人类可读的纯文本格式显示其输出。这个格式不适用于机器解析或轻松复制配置。
有了这个增强,在 pcs node 属性和 命令中添加了一个 new pcs node utilization-output-format 选项。
现在,您可以以三种格式之一显示配置的节点属性和利用率:
-
文本:以纯文本形式显示输出。这是默认格式。 -
JSON:以机器可读的 JSON 格式显示输出,这对于脚本处理和自动化很有用。 -
cmd:显示输出作为一系列pcs命令,您可以使用它们在不同系统上重新创建相同的配置。
pcs alert config 命令现在支持多种输出格式
在以前的版本中,pcs alert config 命令只以人类可读的纯文本格式显示其输出。这个格式不适用于机器解析或轻松复制配置。
在这个版本中,在 pcs alert config 命令中添加了一个 new -output-format 选项。
现在,您可以使用三种格式之一显示配置的警报:
-
文本:以纯文本形式显示输出。这是默认格式。 -
JSON:以机器可读的 JSON 格式显示输出,这对于脚本处理和自动化很有用。 -
cmd:显示输出作为一系列pcs命令,您可以使用它们在不同系统上重新创建相同的警报配置。
pcs 会自动验证 CIB 以了解潜在的问题
在以前的版本中,pcs 工具不会自动在 Cluster Information Base (CIB)上运行高级验证检查。因此,某些集群错误配置可能会在常规操作过程中保持不变。
有了这个增强,pcs 已被更新,将 Pacemaker 的 CIB 验证工具集成到其工作流中。
因此,pcs 现在会自动执行验证检查,并在运行 pcs status,pcs cluster edit, 或 pcs cluster cib-push 命令时显示结果。
pcs 为失败的 CIB 更新提供更详细的错误消息
在以前的版本中,当使用 pcs cluster edit 或 pcs cluster cib-push 命令时 CIB 更新失败时,Pacemaker 提供的错误消息是通用的。它没有解释故障的具体原因,这会导致对无效配置进行故障排除。
在这个版本中,pcs 已被更新,以便在 CIB push 失败时从 Pacemaker 请求详细的验证检查。
因此,当 CIB 更新被拒绝时,pcs 现在会显示一个特定的错误消息,解释配置出错的内容。
新的 pcs 命令可用于重命名集群
在以前的版本中,无法使用 pcs 命令更改现有集群的名称。管理员必须执行一系列手动步骤,这些步骤比较复杂,并可能导致错误。
有了这个增强,引进了 pcs cluster rename 命令。
现在,您可以轻松地更改现有集群的名称。要重命名集群,请运行以下命令:
pcs cluster rename <new-name>
pcs cluster rename <new-name>
Nutanix AHV 虚拟化的新隔离代理现在可用
在以前的版本中,红帽高可用性附加组件没有为 Nutanix Acropolis Hypervisor (AHV)环境提供专用的隔离代理。
在这个版本中,添加了 fence_nutanix 代理。
现在,您可以为在 Nutanix AHV 平台中运行的集群节点配置 STONITH,启用完全支持的高可用性部署。
Jira:RHEL-68321[1]
改进了 pcs resource meta 命令,以支持捆绑包,并防止客户机节点错误配置
在以前的版本中,pcs resource meta 命令不支持管理捆绑包资源的 meta 属性。另外,命令不会阻止用户错误地修改客户机节点的连接参数,这可能会导致错误的资源。
有了这个增强,pcs resource meta 命令已被重写。
现在,您可以使用 pcs resource meta 更新捆绑包资源的 meta 属性。此外,在客户机节点上使用 命令时,现在它可以防止意外更改连接参数,从而避免潜在的错误配置。
IPaddr2 资源代理现在检测到网络链接失败
在此次更新之前,IPaddr2 资源代理不会监控网络接口的链接状态。因此,IPaddr2 资源继续报告节点上的成功,即使底层接口处于 DOWN 或 LOWERLAYERDOWN 状态,从而导致集群在另一个节点上恢复资源。
在这个版本中,IPaddr2 代理已被改进,以检查接口的链接状态。
因此,如果其网络接口停机,IPaddr2 资源无法正确失败,从而可以正确故障转移。您可以通过在资源配置中设置 check_link_status=false 参数来禁用这个新的默认行为。
Jira:RHEL-7688[1]
fence_aws 代理支持立即关闭电源
在以前的版本中,当 fence_aws 代理执行 off 或 reboot 操作时,它会触发实例的安全关闭。这会在隔离过程中引入一个延迟,因为该节点没有立即关闭。
在这个版本中,在 fence_aws 代理中添加了一个新的 skip_os_shutdown 参数。在 Y-stream 版本中默认启用此参数,并在 Z-stream 版本中默认禁用。
因此,当 skip_os_shutdown 设置为 true 时,fence_aws 代理会绕过安全关闭,并对实例执行立即硬电源。
HAProxy rebase 到 2.8
HAProxy 软件包已 rebase 到上游 Long-Term Support (LTS)版本 2.8。这个版本中的显著变化包括:
- 在之前的 2.4 LTS 版本结束(EOL)日期为 Q2 2026 后,RHEL 9 的安全更新和关键修复。
- 2.4 和 2.8 版本间累积的上游稳定性、性能和功能改进。
有关更改的完整列表,请参阅 HAProxy 网页。
Jira:RHEL-74039[1]