附录 D. 集群服务资源检查及故障切换超时
本附录论述了
rgmanager
如何监控集群资源状态,以及如何修改状态检查间隔。本附录还论述了 __enforce_timeouts
服务参数,它说明操作超时可造成服务失败。
注意
要完整理解本附录中的信息,您需要对资源代理和集群配置文件
/etc/cluster/cluster.conf
有深入的了解。有关 cluster.conf
元素和属性的完整列表,请参考 /usr/share/cluster/cluster.rng
中的集群方案,注释的方案位于 /usr/share/doc/cman-X.Y.ZZ/cluster_conf.html
(例如:/usr/share/doc/cman-3.0.12/cluster_conf.html
)。
D.1. 修改资源状态检查间隔
rgmanager
检查各个资源的状态,而不是整个服务。rgmanager 每 10 秒钟扫描一次资源树,检查那些超过其“状态检查”间隔的资源。
每个资源代理都指定状态检查周期间的时间。每个资源都使用这些超时值,除非在
cluster.conf
中使用特殊 <action>
标签明确说明。
<action name="status" depth="*" interval="10" />
这个标签是
cluster.conf
文件中资源本身衍生的文件系统。例如:如果您有一个文件系统,您想要覆盖其状态检查间隔,您就可以在 cluster.conf
文件中按如下方法指定文件系统:
<fs name="test" device="/dev/sdb3"> <action name="status" depth="*" interval="10" /> <nfsexport...> </nfsexport> </fs>
有些代理提供多个检查“深度”。例如:常规文件系统状态检查(深度 0)检查该文件系统是否挂载到正确的位置。更集中的检查(深度 10)则会查看您是否可以从文件系统中读取文件。状态检查深度 20 会查看您是否可以写入该文件系统。在给出的示例中将
depth
设定为 *
,表示这些值可用于所有深度。结果是每 10 秒钟对 test
文件系统执行一次由资源代理提供的最高定义的深度(在此是 20)检查 。