6.12. 高可用性和集群
pcs
现在在创建或更新资源时验证资源参数
当您创建或更新集群资源时,pcs
命令行界面现在会自动要求资源代理验证您输入的参数。如果指定了 --agent-validation
,无效的参数会产生错误。为了保持向后兼容性,如果您没有指定 --agent-validation
,无效的参数会打印一条警告,但不会防止错误配置。
新的 -yes
标志,以确认潜在的破坏性操作
要确认潜在的破坏性操作,如销毁集群、解除阻止仲裁或确认被隔离的节点,pcs
命令行界面现在支持 --yes
标志。在以前的版本中,您可以使用 --force
标志确认这些操作,该标志也用于覆盖验证错误。当将这两个功能合并在一个标志中时,当用户只是想覆盖验证错误时,可能会无意中确认潜在的破坏性操作。现在您应该使用 --force
标志来覆盖验证错误,且您应该使用 --yes
标志来确认潜在的破坏性操作。
新的 pcs status wait
命令
pcs
命令行界面现在提供 pcs status wait
命令。此命令可确保 Pacemaker 完成对 Cluster Information Base (CIB)的更改所需的任何操作,不需要执行任何进一步的操作,使实际集群状态与请求的集群状态匹配。
Jira:RHEL-38491[1]
pcs
支持查询集群中资源状态的新命令
pcs
命令行界面现在提供 pcs status query resource
命令,以查询集群中单个资源的各种属性。这些命令查询:
- 资源的存在
- 资源的类型
- 资源的状态
- 有关集体资源成员的各种信息
- 资源在哪些节点上运行
您可以将这些命令用于基于 pcs 的脚本,因为不需要解析纯文本输出。
Jira:RHEL-38489[1]
新的 pcs resource defaults
和 pcs resource op defaults
选项用于以文本、JSON 和命令格式显示配置
pcs resource defaults
和 pcs resource op defaults
命令及其别名 pcs stonith defaults
和 pcs stonith op defaults
现在提供 --output-format
选项。
-
指定
--output-format=text
以纯文本格式显示配置的资源默认值或操作默认值,这是此选项的默认值。 -
指定
--output-format=cmd
会显示从当前集群默认值配置中创建的pcs resource defaults
或pcs resource op defaults
命令。您可以使用这些命令在不同系统上重新创建配置的资源默认值或资源操作默认值。 -
指定
--output-format=json
以 JSON 格式显示配置的资源默认值或资源操作默认值,这适用于机器解析。
Jira:RHEL-38487[1]
pcsd
Web UI 现在作为一个 RHEL web 控制台附加组件提供
当安装了 cockpit-ha-cluster
软件包时,pcsd
Web UI 现在作为 HA 集群管理 RHEL web 控制台附加组件提供。它不再作为独立接口运行。
关闭 panic 节点,而无需自动重启的新的 Pacemaker 选项
您现在可以将 /etc/sysconfig/pacemaker
配置文件中的 PCMK_panic_action
变量设置为 off
或 sync-off
。当您将此变量设置为 off
或 sync-off
时,节点会在 panic 情况后保持关闭,而不是自动重启。
用于以文本、JSON 和命令格式显示集群资源标签的新的 pcs tag
命令选项
pcs tag [config]
命令现在支持以下用例的 --output-format
选项:
-
通过指定
--output-format=text
,以纯文本格式显示配置的文本。这是此选项的默认值。 -
通过指定
--output-format=cmd
显示从当前集群标签配置创建的命令。您可以使用这些命令在不同的系统上重新创建配置的标签。 -
通过指定
--output-format=json
以 JSON 格式显示配置的标签,这适合机器解析。
支持以 JSON 格式和 pcs
命令导出隔离级别配置
pcs stonith config
和 pcs stonith level config
命令现在支持 --output-format=
选项,来以 JSON 格式显和 pcs
命令示隔离级别配置。
-
指定
--output-format=cmd
会显示从配置隔离级别的当前集群配置创建的pcs
命令。您可以使用这些命令在不同系统上重新创建配置的隔离级别。 -
指定
--output-format=json
,以 JSON 格式显示隔离级别配置,这适用于机器解析。
使用单个 pcs
命令删除多个资源
在此更新之前,pcs resource delete
、pcs resource remove
、pcs stonith delete
和 pcs stonith remove
命令支持一次只移除一个资源。有了此更新,您现在可以使用单个命令一次删除多个资源。
简化了全局唯一集群资源克隆的配置
要将集群资源克隆配置为全局唯一,现在在创建之前创建的资源或资源组的克隆时配置克隆选项 clone-node-max > 1
就足够了。也不再需要配置克隆选项 globally-unique="true"
。
支持使用 SL/TLS 证书加密 Pacemaker 远程连接
您现在可以使用 X.509 (SSL/TLS)证书加密 Pacemaker 远程连接。在以前的版本中,预共享密钥(PSK)只支持加密。通过对 SL/TLS 证书的支持,您可以使用现有主机证书进行 Pacemaker 远程连接。
要为 Pacemaker 远程连接配置 SSL/TLS 证书:
-
使用
pcs cluster node add-guest
命令或pcs cluster node add-remote
命令创建远程连接。当您创建远程连接时,连接使用 PSK 加密。 -
通过在所有集群节点和 Pacemaker 远程节点上更新
PCMK_ca_file
、PCMK_cert_file
、PCMK_key_file
以及可选的PCMK_crl_file
变量来将远程连接转换为使用证书。
有关使用 SL/TLS 证书配置加密的详情,请参考 pacemaker_remote
节点的主机和客户机身份验证。
更新了 Pacemaker 规则中的日期规范和 duration 选项
Pacemaker 规则不再支持以下选项:
-
无效的
duration
选项:monthdays
,moon
,weekdays
,weekyears
,yearsdays
-
无效的
date-spec
选项:moon
,yearsdays
Pacemaker 规则现在支持以下选项:
-
支持的
duration
选项现在为seconds
,minutes
,hours
,days
,weeks
,months
和years
。 -
支持的
date-spec
选项现在为seconds
,minutes
,hours
,monthdays
,weekdays
,yeardays
,months
,weeks
,years
和weekyears
。
您可以在以下 pcs
命令中配置将 duration
和 date-spec
选项合并的规则:
-
pcs resource defaults
-
pcs stonith defaults
-
pcs resource op defaults
-
pcs stonith op defaults
-
pcs constraint location
Jira:RHEL-49527, Jira:RHEL-49524
从 Booth 配置中删除后,从 CIB 中删除 Booth 集群票据
使用 pcs booth ticket remove
命令删除 Booth 集群票据后,Booth 票据的状态会在 Cluster Information Base (CIB)中保持 loaded 。在从一个站点上的 Booth 配置中删除一个票据,并使用 pcs booth pull
命令将 Booth 配置拉取到另一个站点后,也会出现这种情况。当您配置一个票据约束时,这可能会导致问题,因为即使票据约束被删除后,也可以授予票据约束。因此,集群可能冻结或隔离一个节点。您可以使用 pcs booth ticket cleanup
命令从 CIB 中删除 Booth 票据来防止这种情况。
有关从 CIB 中删除 Booth 票据的详情,请参考 删除 Booth 票据。
Jira:RHEL-12709, Jira:RHEL-7602
支持新的 Ha 集群管理功能
对于 RHEL 10,pcsd
Web UI 现在作为 RHEL web 控制台附加组件,作为 HA 集群管理应用程序提供。它不再作为独立接口运行。HA 集群管理应用程序现在支持以下功能:
-
当您将
placement-strategy
集群属性设置为default
时,HA 集群管理应用程序在节点和资源的使用率属性旁边会显示一条警告。此警告指出,由于placement-strategy
配置,使用率没有任何影响。 - HA 集群管理应用程序支持 dark 模式,您可以通过 masthead 中的用户菜单进行设置。
Jira:RHEL-38493[1], Jira:RHEL-38496