9.5. 集群服务挂起


当集群服务尝试 fence 某个节点时,该集群服务会停止,直到成功完成 fence 操作。因此,如果您使用集群控制的存储或者服务挂起,且集群节点显示不同的集群成员,或者当您尝试 fence 某个节点时集群挂起,您需要重启节点进行恢复时,请检查以下方面:
  • 该集群可能尝试 fence 某个节点,且 fence 操作可能已经失败。
  • 查看所有节点中的 /var/log/messages 文件,看看是否有失败的 fence 信息。如果有,重启集群中的那些节点,并正确配置 fencing。
  • 确认没有出现如 第 9.8 节 “双节点集群的每个节点都报告第二个节点无法工作” 所示的网络分割。同时确认节点间可进行沟通,网络正常工作。
  • 如果有节点离开该集群,剩余的节点可能不足构成集群。集群需要有一定量的节点方可操作。如果删除节点导致该节点没有足够量的节点,则服务和存储将会挂起。您可以调整预期的票数或者在该集群中保持所需节点数。

注意

您可以使用 fence_node 命令或者 Conga 手动 fence 某个节点。详情请查看fence_node man page 和 第 4.3.2 节 “使节点离开或者加入集群”
Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.