6.9. 高可用性和集群
IPaddr2 资源代理现在检测到网络链接失败
在此次更新之前,IPaddr2 资源代理不会监控网络接口的链接状态。因此,IPaddr2 资源继续报告节点上的成功,即使底层接口处于 DOWN 或 LOWERLAYERDOWN 状态,从而导致集群在另一个节点上恢复资源。
在这个版本中,IPaddr2 代理已被改进,以检查接口的链接状态。
因此,如果其网络接口停机,IPaddr2 资源无法正确失败,从而可以正确故障转移。您可以通过在资源配置中设置 check_link_status=false 参数来禁用这个新的默认行为。
Jira:RHEL-85014[1]
AWS 资源代理重复使用 IMDS 令牌来提高可靠性
在此次更新之前,AWS 资源代理为每个操作请求一个新的实例元数据服务(IMDS)令牌。这可能会导致单个节点上的大量 API 调用,这会增加资源故障的风险,特别是在具有多个 AWS 资源的环境中。
在这个版本中,AWS 资源代理缓存并重复使用 IMDS 令牌,直到它们过期为止。
因此,对 AWS 元数据服务的 API 调用卷会显著降低。这提高了高可用性集群中 AWS 资源的性能和可靠性。
Jira:RHEL-81237[1]
awsvip 资源代理允许指定网络接口
在此次更新之前,awsvip 资源代理总是将虚拟 IP 地址分配给 EC2 实例的主网络接口。无法将二级网络接口用于该资源。
在这个版本中,在 awsvip 代理中添加了一个 interface 参数。
通过使用此参数,您可以指定代理应该分配虚拟 IP 的网络接口,这样可在 AWS 中启用更灵活的网络配置。
Jira:RHEL-81236[1]
fence_sbd 代理可以自动检测 SBD 设备
在此次更新之前,在配置 fence_sbd 资源时,您需要使用 devices 参数明确指定 SBD 设备路径。
在这个版本中,fence_sbd 代理现在可以从系统检索设备配置。
因此,如果您在创建 fence_sbd 资源时没有设置 devices 参数,代理会自动使用 /etc/sysconfig/sbd 文件中的 SBD_DEVICE 变量中指定的设备。
Jira:RHEL-79799[1]
watchdog 设备列表提供更详细的信息
在此次更新之前,当列出可用的 watchdog 设备时,输出仅显示设备路径,如 /dev/watchdog0。这使得管理员难以区分同一系统上的多个设备。
在这个版本中,输出包括每个 watchdog 的设备路径、身份和驱动程序。这允许轻松识别并选择正确的设备。
Nutanix AHV 虚拟化的新隔离代理现在可用
在以前的版本中,红帽高可用性附加组件没有为 Nutanix Acropolis Hypervisor (AHV)环境提供专用的隔离代理。
在这个版本中,添加了 fence_nutanix 代理。
现在,您可以为在 Nutanix AHV 平台中运行的集群节点配置 STONITH,启用完全支持的高可用性部署。
Jira:RHEL-68322[1]
pcs 在删除最后一个隔离设备前警告用户
在此次更新之前,pcs allowed users to disable or remove the last fence device from a cluster, without a warning.这可能会意外地使集群处于不受支持的状态,而无需配置任何 STONITH 或 SBD 隔离。
有了这个增强,pcs 现在包含一个安全检查,以防止意外删除所有隔离机制。
因此,如果您试图使集群没有隔离,pcs 会显示一个错误并默认阻止更改。例如,当您尝试在禁用 SBD 时删除最后一个 STONITH 资源时会出现这种情况。如果需要,您可以覆盖此安全检查来强制更改。
pcs 为失败的 CIB 更新提供更详细的错误消息
在以前的版本中,当使用 pcs cluster edit 或 pcs cluster cib-push 命令时 CIB 更新失败时,Pacemaker 提供的错误消息是通用的。它没有解释故障的具体原因,这会导致对无效配置进行故障排除。
在这个版本中,pcs 已被更新,以便在 CIB push 失败时从 Pacemaker 请求详细的验证检查。
因此,当 CIB 更新被拒绝时,pcs 现在会显示一个特定的错误消息,解释配置出错的内容。
pcs alert config 命令现在支持多种输出格式
在以前的版本中,pcs alert config 命令只以人类可读的纯文本格式显示其输出。这个格式不适用于机器解析或轻松复制配置。
在这个版本中,在 pcs alert config 命令中添加了一个 new -output-format 选项。
现在,您可以以三种格式之一显示配置的警报:* 文本: 以纯文本形式显示输出。这是默认格式。* JSON :以机器可读的 JSON 格式显示输出,这对于脚本处理和自动化很有用。* cmd :将输出显示为一系列 pcs 命令,您可以使用它们在不同系统上重新创建相同的警报配置。
改进了 pcs resource meta 命令,以支持捆绑包,并防止客户机节点错误配置
在以前的版本中,pcs resource meta 命令不支持管理捆绑包资源的 meta 属性。另外,命令不会阻止用户错误地修改客户机节点的连接参数,这可能会导致错误的资源。
有了这个增强,pcs resource meta 命令已被重写。
现在,您可以使用 pcs resource meta 更新捆绑包资源的 meta 属性。此外,在客户机节点上使用 命令时,现在它可以防止意外更改连接参数,从而避免潜在的错误配置。
新的 pcs 命令可用于重命名集群
在以前的版本中,无法使用 pcs 命令更改现有集群的名称。管理员必须执行一系列手动步骤,这些步骤比较复杂,并可能导致错误。
有了这个增强,引进了 pcs cluster rename 命令。
现在,您可以轻松地更改现有集群的名称。要重命名集群,请运行以下命令:
pcs cluster rename <new-name>
pcs cluster rename <new-name>
pcs node 属性和 pcs node utilization 命令现在支持多种输出格式
在以前的版本中,pcs node 属性和 pcs node utilization 命令仅以人类可读的纯文本格式显示其输出。这个格式不适用于机器解析或轻松复制配置。
有了这个增强,在 pcs node 属性和 命令中添加了一个 new pcs node utilization-output-format 选项。
现在,您可以以三种格式之一显示配置的节点属性和利用率:* 文本 :以纯文本形式显示输出。这是默认格式。* JSON :以机器可读的 JSON 格式显示输出,这对于脚本处理和自动化很有用。* cmd :将输出显示为一系列 pcs 命令,您可以使用它们在不同系统上重新创建相同的配置。
pcs 会自动验证 CIB 以了解潜在的问题
在以前的版本中,pcs 工具不会自动在 Cluster Information Base (CIB)上运行高级验证检查。因此,某些集群错误配置可能会在常规操作过程中保持不变。
有了这个增强,pcs 已被更新,将 Pacemaker 的 CIB 验证工具集成到其工作流中。
因此,pcs 现在会自动执行验证检查,并在运行 pcs status,pcs cluster edit, 或 pcs cluster cib-push 命令时显示结果。
用于管理加密卷的新 crypt 资源代理
在以前的版本中,红帽高可用性附加组件不提供用于管理加密设备的资源代理。这使得难以将 cryptsetup 加密的卷配置为 Pacemaker 集群中高度可用的资源。
在这个版本中,引进了新的 crypt 资源代理。
因此,您可以将加密的本地或网络卷配置为集群资源。crypt 代理使用 cryptsetup 管理这些设备。它支持使用标准 key_file 解锁卷,并支持使用 tang/clevis 进行网络绑定解锁。
Jira:RHEL-13089[1]