Capítulo 4. Cercado
El cercado es la desconexión de un nodo desde el almacenamiento compartido del clúster. Este proceso corta la E/S desde y al almacenamiento compartido asegurando así la integridad de los datos. La infraestructura de clúster ejecuta el proceso de aislamiento a través del demonio de cercado
fenced
.
Cuando CMAN determina que el nodo ha fallado, comunica al otro clúster que los componentes de infraestructura de clúster han fallado. Cuando se notifica la falla al comando
fenced
, encierra el nodo que ha fallado. Otros componentes de infraestructura de clúster determinan las acciones a seguir — es decir, realizan cualquier recuperación que sea necesaria. Por ejemplo, cuando se notifica a DLM y GFS2 sobre la falla del nodo, suspenden la actividad hasta que detectan que el comando fenced
ha completado el cercado del nodo fallido. Tras confirmación de que el nodo fallido ha sido cercado, DLM y GFS2 realizan la recuperación. DLM abre cerrojos del nodo fallido y GFS2 recupera el diario del nodo fallido.
El programa de aislamiento determina el método de cercado a utilizar desde el archivo de configuración de clúster. Hay dos elementos claves del archivo de configuración de clúster que definen el método de cercado: el agente y el dispositivo de cercado. El programa de cercado hace una llamada al agente de cercado especificado en el archivo de configuración del clúster. El agente de cercado, a su vez, aísla el nodo a través del dispositivo de cercado. Una vez el proceso de aislamiento ha sido completado, el programa de aislamiento notifica al administrador de clúster.
La adición de alta disponibilidad proporciona una variedad de métodos de cercado:
- Aislamiento de energía — Un método de cercado que utiliza un controlador de energía para apagar el nodo que no funciona.
- Cercado de almacenamiento — Un método de cercado que inhabilita el puerto de canal de fibra que conecta el almacenamiento a un nodo que no funciona.
- Otros métodos de cercado — Hay otros métodos de cercado que desactivan la E/S o apagan el nodo que no funciona; incluidos IBM Bladecenters, PAP, DRAC/MC, HP ILO, IPMI, IBM RSA II y otros.
La Figura 4.1, “Ejemplo de cercado de energía” muestra un ejemplo de cercado de energía. En el ejemplo, el programa de cercado en el nodo A hace que el controlador de energía apague el nodo D. La Figura 4.2, “Ejemplo de cercado de almacenamiento” muestra un ejemplo de cercado de almacenamiento. En el ejemplo, el programa de cercado en nodo A hace que el interruptor de Canal de fibra inhabilite el puerto para el nodo D, al desconectar el nodo D del almacenamiento. .
Figura 4.1. Ejemplo de cercado de energía
Figura 4.2. Ejemplo de cercado de almacenamiento
Para especificar un método de cercado se debe editar el archivo de configuración para asignar el nombre del método de cercado, el agente de cercado y el dispositivo de cercado para cada nodo en el clúster.
La forma en que se especifica un método de cercado depende de si el nodo tiene abastecimiento de energía doble o rutas múltiples de almacenamiento. Si un nodo tiene abastecedores de energía doble, entonces el método de cercado para el nodo debe especificar al menos dos dispositivos de cercado — un dispositivo de cercado para cada abastecedor de energía (ver la Figura 4.3, “Cercado de un nodo con abastecedores de energía doble”). Igualmente, si un nodo tiene múltiples rutas a almacenamiento de Canal de fibra, entonces el método de cercado para el nodo debe especificar un dispositivo de cercado para cada ruta al almacenamiento de Canal de fibra. Por ejemplo, si un nodo tiene dos rutas al almacenamiento de Canal de fibra, el método de cercado debe especificar dos dispositivos de cercado — uno para cada ruta al almacenamiento de Canal de fibra (ver la Figura 4.4, “Cercado de un nodo con conexiones de canal de fibra doble”).
Figura 4.3. Cercado de un nodo con abastecedores de energía doble
Figura 4.4. Cercado de un nodo con conexiones de canal de fibra doble
Puede configurar un nodo con uno o más métodos de cercado. Cuando se utiliza más de un método de cercado, se utilizan en cascada, en el orden de prioridad dado en el archivo de configuración de clúster. Si un nodo falla, es aislado mediante el primer método de cercado especificado en el archivo de configuración de clúster para ese nodo. Si el primer método de cercado no funciona, se utiliza el siguiente método de cercado especificado para ese nodo. Si ninguno de los métodos de cercado funciona, el primer método de cercado se ejecutará nuevamente y este bucle continúa hasta que el nodo haya sido cercado.
Para obtener información más detallada sobre configuración de dispositivos de cercado, consulte el capítulo correspondiente en el manual de Administración de clúster.