7.3. O sistema de arquivo GFS2 fica pendurado e requer a reinicialização de todos os nós
Se seu sistema de arquivos GFS2 estiver pendurado e não retornar comandos executados contra ele, exigindo que você reinicie todos os nós do cluster antes de usá-lo, verifique as seguintes questões.
- Você pode ter tido uma cerca fracassada. Os sistemas de arquivos GFS2 congelarão para garantir a integridade dos dados no caso de uma cerca falhada. Verifique os registros de mensagens para ver se há alguma cerca falhada no momento do enforcamento. Certifique-se de que as cercas estejam configuradas corretamente.
O sistema de arquivos GFS2 pode ter sido retirado. Verifique através dos registros de mensagens a palavra
withdraw
e verifique se há mensagens e traços de chamadas do GFS2 indicando que o sistema de arquivo foi retirado. Uma retirada é indicativa de corrupção do sistema de arquivos, falha no armazenamento ou um bug. No primeiro momento em que for conveniente desmontar o sistema de arquivo, você deve realizar o seguinte procedimento:Reiniciar o nó em que ocorreu a retirada.
#
/sbin/reboot
Parar o recurso do sistema de arquivos para desmontar o sistema de arquivos GFS2 em todos os nós.
#
pcs resource disable --wait=100 mydata_fs
Capture os metadados com o comando
gfs2_edit savemeta…
. Você deve garantir que haja espaço suficiente para o arquivo, que em alguns casos pode ser grande. Neste exemplo, os metadados são salvos em um arquivo no diretório/root
.#
gfs2_edit savemeta /dev/vg_mydata/mydata /root/gfs2metadata.gz
Atualize o pacote
gfs2-utils
.#
sudo yum update gfs2-utils
Em um nó, execute o comando
fsck.gfs2
no sistema de arquivos para garantir a integridade do sistema de arquivos e reparar qualquer dano.#
fsck.gfs2 -y /dev/vg_mydata/mydata > /tmp/fsck.out
Após o comando
fsck.gfs2
ter sido concluído, reative o recurso do sistema de arquivos para devolvê-lo ao serviço:#
pcs resource enable --wait=100 mydata_fs
Abra um ticket de suporte com o Red Hat Support. Informe-os que você experimentou uma retirada do GFS2 e forneça os logs e as informações de depuração geradas pelos comandos
sosreports
egfs2_edit savemeta
.Em alguns casos de retirada de um GFS2, comandos podem ser pendurados que estão tentando acessar o sistema de arquivos ou seu dispositivo de bloco. Nesses casos, é necessário um reinício rígido para reiniciar o cluster.
Para informações sobre a função de retirada GFS2, consulte o sistema de arquivos GFS2 indisponível para um nó (a função de retirada GFS2).
- Este erro pode ser indicativo de um problema de travamento ou bug. Reúna dados durante uma dessas ocorrências e abra um ticket de suporte com o Red Hat Support, como descrito em Gathering GFS2 data for troubleshooting.