Rechercher

Chapitre 21. Opérations de surveillance des ressources

download PDF

Pour vous assurer que les ressources restent saines, vous pouvez ajouter une opération de surveillance à la définition d'une ressource. Si vous ne spécifiez pas d'opération de surveillance pour une ressource, la commande pcs créera par défaut une opération de surveillance, avec un intervalle déterminé par l'agent de ressources. Si l'agent de ressources ne fournit pas d'intervalle de surveillance par défaut, la commande pcs créera une opération de surveillance avec un intervalle de 60 secondes.

Le tableau suivant résume les propriétés d'une opération de contrôle des ressources.

Tableau 21.1. Propriétés d'une opération
FieldDescription

id

Nom unique de l'action. Le système l'attribue lorsque vous configurez une opération.

name

L'action à effectuer. Valeurs courantes : monitor, start, stop

interval

Si la valeur est différente de zéro, une opération récurrente est créée et se répète à cette fréquence, en secondes. Une valeur non nulle n'a de sens que lorsque l'action name est définie sur monitor. Une action de contrôle récurrente est exécutée immédiatement après le démarrage d'une ressource, et les actions de contrôle suivantes sont programmées à partir de l'heure à laquelle l'action de contrôle précédente s'est achevée. Par exemple, si une action de contrôle avec interval=20s est exécutée à 01:00:00, l'action de contrôle suivante ne se produit pas à 01:00:20, mais 20 secondes après la fin de la première action de contrôle.

S'il est fixé à zéro, ce qui est la valeur par défaut, ce paramètre vous permet de fournir des valeurs à utiliser pour les opérations créées par le cluster. Par exemple, si interval est défini à zéro, que name de l'opération est défini à start et que la valeur timeout est définie à 40, Pacemaker utilisera un délai d'attente de 40 secondes lors du démarrage de cette ressource. Une opération monitor avec un intervalle de zéro vous permet de définir les valeurs timeout/on-fail/enabled pour les sondes que Pacemaker effectue au démarrage afin d'obtenir l'état actuel de toutes les ressources lorsque les valeurs par défaut ne sont pas souhaitables.

timeout

Si l'opération ne se termine pas dans le délai fixé par ce paramètre, elle est interrompue et considérée comme ayant échoué. La valeur par défaut est la valeur de timeout si elle est définie avec la commande pcs resource op defaults, ou 20 secondes si elle n'est pas définie. Si vous constatez que votre système comprend une ressource qui nécessite plus de temps que le système ne le permet pour effectuer une opération (telle que start, stop, ou monitor), recherchez-en la cause et si le temps d'exécution prolongé est prévu, vous pouvez augmenter la valeur de ce paramètre.

La valeur timeout n'est pas un délai de quelque nature que ce soit, et le cluster n'attend pas la totalité de la période de temporisation si l'opération revient avant la fin de la période de temporisation.

on-fail

L'action à entreprendre si cette action échoue. Valeurs autorisées :

* ignore - Faire comme si la ressource n'avait pas échoué

* block - Ne pas effectuer d'autres opérations sur la ressource

* stop - Arrêter la ressource et ne pas la lancer ailleurs

* restart - Arrêter la ressource et la relancer (éventuellement sur un autre nœud)

* fence - STONITH le nœud sur lequel la ressource a échoué

* standby - Déplacer les ressources all loin du nœud sur lequel la ressource a échoué

* migrate - Migrer la ressource vers un autre nœud, si possible. Cela équivaut à donner la valeur 1 à l'option migration-threshold resource meta.

* demote - Lorsqu'une action promote échoue pour la ressource, celle-ci est rétrogradée mais n'est pas complètement arrêtée. Lorsqu'une action monitor échoue pour une ressource, si interval a une valeur non nulle et que role a une valeur égale à Promoted, la ressource est rétrogradée mais n'est pas totalement arrêtée.

La valeur par défaut de l'opération stop est fence lorsque l'option STONITH est activée et block dans le cas contraire. Pour toutes les autres opérations, la valeur par défaut est restart.

enabled

Si false, l'opération est traitée comme si elle n'existait pas. Valeurs autorisées : true, false

21.1. Configuration des opérations de surveillance des ressources

Vous pouvez configurer les opérations de surveillance lorsque vous créez une ressource à l'aide de la commande suivante.

pcs resource create resource_id standard:provider:type|type [resource_options] [op operation_action operation_options [operation_type operation_options ]...]

Par exemple, la commande suivante crée une ressource IPaddr2 avec une opération de surveillance. La nouvelle ressource s'appelle VirtualIP et possède une adresse IP de 192.168.0.99 et un masque de réseau de 24 sur eth2. Une opération de surveillance sera effectuée toutes les 30 secondes.

# pcs resource create VirtualIP ocf:heartbeat:IPaddr2 ip=192.168.0.99 cidr_netmask=24 nic=eth2 op monitor interval=30s

Vous pouvez également ajouter une opération de surveillance à une ressource existante à l'aide de la commande suivante.

pcs resource op add resource_id operation_action [operation_properties]

La commande suivante permet de supprimer une opération de ressource configurée.

pcs resource op remove resource_id operation_name operation_properties
Note

Vous devez spécifier les propriétés exactes de l'opération pour supprimer correctement une opération existante.

Pour modifier les valeurs d'une option de surveillance, vous pouvez mettre à jour la ressource. Par exemple, vous pouvez créer un site VirtualIP à l'aide de la commande suivante.

# pcs resource create VirtualIP ocf:heartbeat:IPaddr2 ip=192.168.0.99 cidr_netmask=24 nic=eth2

Par défaut, cette commande crée ces opérations.

Operations: start interval=0s timeout=20s (VirtualIP-start-timeout-20s)
            stop interval=0s timeout=20s (VirtualIP-stop-timeout-20s)
            monitor interval=10s timeout=20s (VirtualIP-monitor-interval-10s)

Pour modifier le délai d'arrêt, exécutez la commande suivante.

# pcs resource update VirtualIP op stop interval=0s timeout=40s

# pcs resource config VirtualIP
 Resource: VirtualIP (class=ocf provider=heartbeat type=IPaddr2)
  Attributes: ip=192.168.0.99 cidr_netmask=24 nic=eth2
  Operations: start interval=0s timeout=20s (VirtualIP-start-timeout-20s)
              monitor interval=10s timeout=20s (VirtualIP-monitor-interval-10s)
              stop interval=0s timeout=40s (VirtualIP-name-stop-interval-0s-timeout-40s)
Red Hat logoGithubRedditYoutubeTwitter

Apprendre

Essayez, achetez et vendez

Communautés

À propos de la documentation Red Hat

Nous aidons les utilisateurs de Red Hat à innover et à atteindre leurs objectifs grâce à nos produits et services avec un contenu auquel ils peuvent faire confiance.

Rendre l’open source plus inclusif

Red Hat s'engage à remplacer le langage problématique dans notre code, notre documentation et nos propriétés Web. Pour plus de détails, consultez leBlog Red Hat.

À propos de Red Hat

Nous proposons des solutions renforcées qui facilitent le travail des entreprises sur plusieurs plates-formes et environnements, du centre de données central à la périphérie du réseau.

© 2024 Red Hat, Inc.