Pesquisar

Capítulo 20. Operações de monitoramento de recursos

download PDF

Para garantir que os recursos permaneçam saudáveis, você pode acrescentar uma operação de monitoramento à definição de um recurso. Se você não especificar uma operação de monitoramento para um recurso, por padrão o comando pcs criará uma operação de monitoramento, com um intervalo que é determinado pelo agente do recurso. Se o agente de recursos não fornecer um intervalo de monitoramento padrão, o comando pcs criará uma operação de monitoramento com um intervalo de 60 segundos.

Tabela 20.1, “Propriedades de uma operação” resume as propriedades de uma operação de monitoramento de recursos.

Tabela 20.1. Propriedades de uma operação
CampoDescrição

id

Nome único para a ação. O sistema atribui isto quando você configura uma operação.

name

A ação a realizar. Valores comuns: monitor, start, stop

interval

Se definido para um valor diferente de zero, é criada uma operação recorrente que se repete nesta freqüência, em segundos. Um valor diferente de zero só faz sentido quando a ação name é definida para monitor. Uma ação de monitoramento recorrente será executada imediatamente após o início de um recurso, e as ações de monitoramento subseqüentes são programadas a partir do momento em que a ação de monitoramento anterior for concluída. Por exemplo, se uma ação de monitoramento com interval=20s for executada à 01:00:00, a próxima ação de monitoramento não ocorrerá à 01:00:20, mas aos 20 segundos após a conclusão da primeira ação de monitoramento.

Se definido como zero, que é o valor padrão, este parâmetro permite fornecer valores a serem usados para operações criadas pelo cluster. Por exemplo, se o interval for definido como zero, o name da operação é definido como start, e o valor timeout é definido como 40, então o Pacemaker usará um timeout de 40 segundos ao iniciar este recurso. Uma operação monitor com intervalo zero permite definir os valores de timeout/on-fail/enabled para as sondas que o Pacemaker faz na inicialização para obter o status atual de todos os recursos quando os padrões não são desejáveis.

timeout

Se a operação não for concluída no tempo definido por este parâmetro, abortar a operação e considerá-la fracassada. O valor padrão é o valor de timeout se configurado com o comando pcs resource op defaults, ou 20 segundos se não estiver configurado. Se você descobrir que seu sistema inclui um recurso que requer mais tempo do que o sistema permite para realizar uma operação (como start, stop, ou monitor), investigue a causa e se o longo tempo de execução é esperado, você pode aumentar este valor.

O valor timeout não é um atraso de nenhum tipo, nem o cluster espera todo o período de timeout se a operação retornar antes que o período de timeout tenha terminado.

on-fail

A ação a ser tomada se esta ação falhar. Os valores permitidos:

* ignore - Finja que o recurso não falhou

* block - Não realizar nenhuma outra operação sobre o recurso

* stop - Pare o recurso e não o inicie em outro lugar

* restart - Pare o recurso e inicie-o novamente (possivelmente em um nó diferente)

* fence - STONITH o nó sobre o qual o recurso falhou

* standby - Afastar all recursos do nó em que o recurso falhou

* demote - Quando uma ação promote falha para o recurso, o recurso será rebaixado, mas não será totalmente interrompido. Quando uma ação monitor falhar para um recurso, se interval estiver definido para um valor diferente de zero e role estiver definido para Master, o recurso será rebaixado, mas não será totalmente interrompido.

O padrão para a operação stop é fence quando a STONITH está habilitada e block caso contrário. Todas as outras operações são padrão para restart.

enabled

Se false, a operação é tratada como se ela não existisse. Valores permitidos: true, false

20.1. Configuração de operações de monitoramento de recursos

Você pode configurar as operações de monitoramento ao criar um recurso, usando o seguinte comando.

pcs resource create resource_id standard:provider:type|type [resource_options] [op operation_action operation_options [operation_type operation_options ]...]

Por exemplo, o seguinte comando cria um recurso IPaddr2 com uma operação de monitoramento. O novo recurso é chamado VirtualIP com um endereço IP de 192.168.0.99 e uma máscara de rede de 24 em eth2. Uma operação de monitoramento será realizada a cada 30 segundos.

# pcs resource create VirtualIP ocf:heartbeat:IPaddr2 ip=192.168.0.99 cidr_netmask=24 nic=eth2 op monitor interval=30s

Alternativamente, você pode adicionar uma operação de monitoramento a um recurso existente com o seguinte comando.

pcs resource op adicionar resource_id operation_action [operation_properties]

Use o seguinte comando para excluir uma operação de recurso configurado.

pcs resource op remove resource_id operation_name operation_properties
Nota

Você deve especificar as propriedades exatas da operação para remover corretamente uma operação existente.

Para alterar os valores de uma opção de monitoramento, você pode atualizar o recurso. Por exemplo, você pode criar um VirtualIP com o seguinte comando.

# pcs resource create VirtualIP ocf:heartbeat:IPaddr2 ip=192.168.0.99 cidr_netmask=24 nic=eth2

Por padrão, este comando cria estas operações.

Operations: start interval=0s timeout=20s (VirtualIP-start-timeout-20s)
            stop interval=0s timeout=20s (VirtualIP-stop-timeout-20s)
            monitor interval=10s timeout=20s (VirtualIP-monitor-interval-10s)

Para alterar a operação de parada, execute o seguinte comando.

# pcs resource update VirtualIP op stop interval=0s timeout=40s

# pcs resource show VirtualIP
 Resource: VirtualIP (class=ocf provider=heartbeat type=IPaddr2)
  Attributes: ip=192.168.0.99 cidr_netmask=24 nic=eth2
  Operations: start interval=0s timeout=20s (VirtualIP-start-timeout-20s)
              monitor interval=10s timeout=20s (VirtualIP-monitor-interval-10s)
              stop interval=0s timeout=40s (VirtualIP-name-stop-interval-0s-timeout-40s)
Red Hat logoGithubRedditYoutubeTwitter

Aprender

Experimente, compre e venda

Comunidades

Sobre a documentação da Red Hat

Ajudamos os usuários da Red Hat a inovar e atingir seus objetivos com nossos produtos e serviços com conteúdo em que podem confiar.

Tornando o open source mais inclusivo

A Red Hat está comprometida em substituir a linguagem problemática em nosso código, documentação e propriedades da web. Para mais detalhes veja oBlog da Red Hat.

Sobre a Red Hat

Fornecemos soluções robustas que facilitam o trabalho das empresas em plataformas e ambientes, desde o data center principal até a borda da rede.

© 2024 Red Hat, Inc.