9.4. El daemon de clúster se bloquea
RGManager tiene un proceso de vigilancia que reinicia el host si el proceso principal
rgmanager
falla de repente. Esto hace que el nodo de clúster se cerque y rgmanager
recupere el servicio en otro host. Cuando el daemon detecta que el proceso principal rgmanager
se ha bloqueado, entonces reiniciará el nodo de clúster y los nodos de clúster activos detectarán que el nodo de clúster ha salido y lo sacarán del clúster.
El ID de proceso con el número inferior (PID) es un proceso de vigilancia que se realiza si el hijo ( el proceso con el número de PID más alto) se bloquea. Si captura el núcleo del proceso con el número de PID más alto mediante
gcore
puede ayudar durante la corrección de un daemon bloqueado.
Instale los paquetes requeridos para capturar y ver el núcleo y garantizar que tanto
rgmanager
como rgmanager-debuginfo
tengan la misma versión o si no, el núcleo de la aplicación capturado puede ser inservible.
$ yum -y --enablerepo=rhel-debuginfo install gdb rgmanager-debuginfo
9.4.1. Captura del núcleo rgmanager
en tiempo de ejecución
Hay dos procesos de
rgmanager
que están en ejecución cuando se inicia. Debe capturar el núcleo para el proceso rgmanager
con el PID más alto.
A continuación verá un ejemplo de salida del comando
ps
que muestra dos procesos para rgmanager
.
$ ps aux | grep rgmanager | grep -v grep root 22482 0.0 0.5 23544 5136 ? S<Ls Dec01 0:00 rgmanager root 22483 0.0 0.2 78372 2060 ? S<l Dec01 0:47 rgmanager
En el siguiente ejemplo, el programa
pidof
sirve para determinar el número superior de PID, el cual es el PID apropiado para crear el núcleo. El comando completo captura el núcleo de la aplicación para el proceso 22483 que tiene el número más alto de PID.
$ gcore -o /tmp/rgmanager-$(date '+%F_%s').core $(pidof -s rgmanager)