第 9 章 诊断并修正集群中的问题
集群问题的故障排除通常比较困难。这是因为由于系统集群复杂性更大,使之与诊断单一系统的问题完全不同。但是有一些问题是管理员在部署或者管理集群时会经常遇到的。了解如何处理那些常见问题可让您更轻松地部署和管理集群。
本章提供有关集群的常见问题以及如何对其进行故障排除。您可以在我们的知识库中获得更多信息,也可联络授权红帽支持代表寻求帮助。如果您的问题是关于 GFS2 文件系统,您可以在《全局文件系统 2》一书中找到故障排除常见 GFS2 问题的信息。
9.1. 配置更改不生效
修改集群配置后,您必须将那些更改推广到该集群的每个节点中。
- 使用 Conga 配置集群时,Conga 会在应用那些更改时自动将其推广。
- 有关使用
ccs
命令推广集群配置更改的详情请参考 第 5.15 节 “在集群节点中推广配置文件”。 - 有关使用命令行工具推广集群配置更改的详情请参考 第 8.4 节 “更新配置”。
如果在您的集群中进行任何以下配置更改,则在将其推广到集群中后无需重启集群就可使更改生效。
- 从集群配置中删除节点 — 除非节点计数由大于 2 变为等于 2。
- 在集群配置中添加节点 — 除非节点计数由 2 变为大于 2。
- 更改日志设置。
- 添加、编辑或删除 HA 服务或 VM 组件。
- 添加、编辑或删除集群资源。
- 添加、修改和删除故障切换域。
如果您要更改集群的任何其他配置,就必须重启该集群方可使更改生效。以下集群配置更改需要重启集群后方可生效:
- 在集群配置文件中添加或删除
two_node
选项。 - 重命名该集群。
- 更改
corosync
或openais
计时器。 - 从仲裁磁盘中添加、更改或删除探试,更改任意仲裁磁盘计时器,或者更改仲裁磁盘设备。要让这些更改生效,则需要在全局重启
qdiskd
守护进程。 - 为
rgmanager
更改central_processing
模式。要使此更改生效,需要全局重启rgmanager
。 - 更改多播地址。
- 将传输方式从 UDP 多播改为 UDP 单播,或者从 UDP 单播改为 UDP 多播。
您可以使用 Conga、
ccs
或者命令行工具重启该集群。
- 有关使用 Conga 重启集群的详情请参考 第 4.4 节 “启动、停止、刷新和删除集群”。
- 有关使用
ccs
重启集群的详情请参考 第 6.2 节 “启动和停止集群”。 - 有关使用命令行工具重启集群的详情请参考 第 8.1 节 “启动和停止集群软件”。