9.4.2. 守护进程崩溃是捕获 Core
默认情况下
/etc/init.d/functions
脚本会阻断由 /etc/init.d/rgmanager
所调用守护进程的 core 文件。对于要生成应用程序 core 的守护进程,您必须启用那个选项。必须在所有需要捕获应用程序 core 的集群节点中执行这一步骤。
要在 rgmanager 守护进程崩溃时生成 core 文件,请编辑
/etc/sysconfig/cluster
文件。DAEMONCOREFILELIMIT
参数可让该守护进程在该进程崩溃时生成 core 文件。使用 -w
选项可阻止 watchdog 进程运行。如果 rgmanager
崩溃,watchdog 守护进程负责重启该集群节点。如果 watchdog 守护进程正在运行,则不会生成该 core 文件,因此一定要禁用它方可捕获 core 文件。
DAEMONCOREFILELIMIT="unlimited" RGMGR_OPTS="-w"
重启 rgmanager 激活新配置选项:
service rgmanager restart
注意
如果在这个集群节点中正在运行集群服务,那么它会以非良好状态离开运行的服务。
如果
rgmanager
进程崩溃生成 core 文件,那么该文件将可以被写入。
ls /core*
输出结果应类似如下:
/core.11926
重启
rgmanager
捕获应用程序 core 前,请移动或删除 / 目录中的所有旧 core 文件。应重启出现 rgmanager
崩溃的集群节点,或者在捕获 core 文件后 fence 该节点以保证没有运行监视进程。