9.5. I servizi del cluster entrano in uno stato di sospensione
Quando i servizi del cluster cercano di eseguire l'isolamento di un nodo essi vengono arrestati fino al completamento dell'operazione di fencing. Per questo motivo se lo storage controllato dal cluster o i servizi entrano in uno stato di sospensione, ed i nodi del cluster mostrano una visuale diversa del membership del cluster, oppure se il cluster è sospeso quando cercate di isolare un nodo e sarà necessario riavviare i nodi per un ripristino, controllate quanto di seguito indicato:
- Il cluster avrà cercato di isolare un nodo ma tale operazione è fallita.
- Controllate il file
/var/log/messages
su tutti i nodi e verificate se sono presenti alcuni messaggi relativi al fallimento del fencing. In caso affermativo riavviare i nodi nel cluster e configurare correttamente il processo di fencing. - Verificate che non sia presente alcuna partizione della rete, come riportato in Sezione 9.8, «Ogni nodo in un cluster a due nodi riporta l'arresto del secondo nodo», che sia possibile una comunicazione tra i nodi e la corretta esecuzione della rete.
- Se i nodi abbandonano il cluster i nodi restanti non avranno più il quorum corretto. Il cluster avrà bosogno del quorum corretto per operare. Con la rimozione dei nodi il cluster non avrà più il quorum necessario per i servizi e si verificherà una sospensione dello storage e dei servizi stessi. In tal caso modificare i voti previsti o implementate nuovamente il numero di nodi all'interno del cluster.
Nota
È possibile isolare un nodo manualmente con il comando
fence_node
o utilizzando Conga. Per informazioni consultare la pagina man di fence_node
e Sezione 4.3.2, «Esclusione o inserimento di un nodo nel cluster».