5.3. GFS2 文件系统挂起并需要重启所有节点
如果您的 GFS2 文件系统挂起且不会返回由此运行的命令,则需要您在使用它之前重启该集群中的所有节点,并检查以下问题。
- 您可能会有一个失败的 fence。GFS2 文件系统将停滞以保证在失败的 fence 事件中数据的完整性。检查信息日志查看挂起时是否有失败的 fence。请确定您正确了配置的 fencing。
- GFS2 文件系统可能已经撤回。检查信息日志查看关键字
withdraw
,看看是否有来自 GFS2 表示已经撤回的文件系统的信息和 calltrace。撤回表示可能为系统崩溃、存储失败或者是一个 bug。卸载该文件系统,更新gfs2-utils
软件包并在该文件系统中执行fsck
命令以便返回该服务。在 Red Hat 支持生成一个支持 ticket。通知它们您有 GFS2 撤回问题,并提供有日志的 sosreport。有关 GFS2 撤回功能的详情请参考 第 4.14 节 “GFS2 收回功能”。 - 这个出错信息表示有锁定问题或者 bug。如果出现这种情况之一,请收集数据并在 Red Hat 支持生成一个支持 ticket,如 第 5.2 节 “GFS2 文件系统挂起并需要在一个节点中重启” 所述。