Chapitre 10. Configuration du délai maximum de récupération des erreurs de stockage avec eh_deadline
Vous pouvez configurer le délai maximum autorisé pour récupérer les périphériques SCSI défaillants. Cette configuration garantit un temps de réponse E/S même lorsque le matériel de stockage ne répond plus en raison d'une défaillance.
10.1. Le paramètre eh_deadline
Le mécanisme de gestion des erreurs SCSI (EH) tente de récupérer les erreurs sur les périphériques SCSI défaillants. Le paramètre de l'objet hôte SCSI eh_deadline
vous permet de configurer la durée maximale de la récupération. À l'expiration du délai configuré, SCSI EH s'arrête et réinitialise l'ensemble de l'adaptateur de bus hôte (HBA).
L'utilisation de eh_deadline
peut réduire le temps nécessaire :
- pour fermer un chemin qui a échoué,
- pour changer de chemin, ou
- pour désactiver une tranche RAID.
Lorsque eh_deadline
expire, SCSI EH réinitialise l'adaptateur de bus hôte, ce qui affecte tous les chemins cibles sur cet adaptateur de bus hôte, et pas seulement celui qui est défaillant. Si certains chemins redondants ne sont pas disponibles pour d'autres raisons, des erreurs d'E/S peuvent se produire. N'activez eh_deadline
que si vous disposez d'une configuration multipath entièrement redondante sur toutes les cibles.
La valeur du paramètre eh_deadline
est spécifiée en secondes. La valeur par défaut est off
, ce qui désactive la limite de temps et permet la récupération de toutes les erreurs.
Scénarios dans lesquels eh_deadline est utile
Dans la plupart des cas, il n'est pas nécessaire d'activer eh_deadline
. L'utilisation de eh_deadline
peut être utile dans certains scénarios spécifiques. Par exemple, si une perte de lien se produit entre un commutateur Fibre Channel (FC) et un port cible, et que le HBA ne reçoit pas de notification de changement d'état enregistré (RSCN), les demandes d'E/S et les commandes de récupération d'erreur sont toutes interrompues au lieu de rencontrer une erreur. Dans ce cas, les demandes d'E/S et les commandes de récupération d'erreur sont toutes interrompues au lieu de rencontrer une erreur. Le fait de définir eh_deadline
dans cet environnement permet de limiter le temps de récupération. Cela permet à l'E/S défaillante d'être réessayée sur un autre chemin disponible par DM Multipath.
Dans les conditions suivantes, le paramètre eh_deadline
n'apporte aucun avantage supplémentaire, car les commandes d'E/S et de reprise sur erreur échouent immédiatement, ce qui permet à DM Multipath d'effectuer une nouvelle tentative :
- Si les RSCN sont activés
- Si le HBA n'enregistre pas le lien devenant indisponible