9.5. 集群服务挂起
当集群服务尝试 fence 某个节点时,该集群服务会停止,直到成功完成 fence 操作。因此,如果您使用集群控制的存储或者服务挂起,且集群节点显示不同的集群成员,或者当您尝试 fence 某个节点时集群挂起,您需要重启节点进行恢复时,请检查以下方面:
- 该集群可能尝试 fence 某个节点,且 fence 操作可能已经失败。
- 查看所有节点中的
/var/log/messages
文件,看看是否有失败的 fence 信息。如果有,重启集群中的那些节点,并正确配置 fencing。 - 确认没有出现如 第 9.8 节 “双节点集群的每个节点都报告第二个节点无法工作” 所示的网络分割。同时确认节点间可进行沟通,网络正常工作。
- 如果有节点离开该集群,剩余的节点可能不足构成集群。集群需要有一定量的节点方可操作。如果删除节点导致该节点没有足够量的节点,则服务和存储将会挂起。您可以调整预期的票数或者在该集群中保持所需节点数。
注意