Anhang A. Probes
Monitoring-berechtigte Systeme können Probes an ihnen angewandt haben, welche ständig ihren einwandfreien Zustand und volle Funktionsfähigkeit bestätigen. Dieser Abschnitt listet die verfügbaren Probes, nach Befehls-Gruppe (wie beispielsweise Apache) unterteilt, auf.
Viele Probes, die interne Aspekte Ihres Systems überwachen (wie beispielsweise die Linux::Disk Usage Probe) statt externe Aspekte (wie beispielsweise die Network Services::SSH Probe), erfordern die Installation des Red Hat Network monitoring daemon (
rhnmd
). Diese Voraussetzung ist in der individuellen Probe-Referenz vermerkt.
Jede Probe hat ihre eigene Referenz in diesem Abschnitt, in der die erforderlichen Felder (markiert mit *), Standardwerte und die Grenzwerte zum Auslösen von Warnmeldungen identifiziert werden. Zu Beginn eines jeden Abschnitts der unterschiedlichen Befehlsgruppen sind Informationen aufgeführt, die auf alle Probes in dieser Gruppe zutreffen. Abschnitt Abschnitt A.1, »Probe-Richtlinien« behandelt allgemeine Richtlinien. Die verbleibenden Abschnitte befassen sich mit individuellen Probes.
Anmerkung
Beinahe alle Probes verwenden das Transmission Control Protocol (TCP) als Transportprotokoll. Ausnahmen davon werden eigens in den Referenzen der jeweiligen Probes angegeben.
A.1. Probe-Richtlinien Link kopierenLink in die Zwischenablage kopiert!
Link kopierenLink in die Zwischenablage kopiert!
Die folgenden allgemeinen Richtlinien umreißen die Bedeutung eines jeden Probe-Status und stellen eine Anleitung zur Festlegung von Grenzwerten dar.
Die folgende Liste liefert eine kurze Beschreibung der Bedeutung eines jeden Probe-Status:
- Unbekannt
- Diese Probes können die Messdaten nicht sammeln, die zur Bestimmung des Probe-Status benötigt werden. Die meisten Probes, wenn auch nicht alle, gehen in diesen Status über, wenn ihr Timeout-Wert überschritten wird. Probes mit diesem Status sind unter Umständen nicht korrekt konfiguriert.
- Ausstehend
- Für diese Probes hat der Red Hat Satellite noch keine Daten erhalten. Es ist normal, dass sich neue Probes in diesem Status befinden. Wenn jedoch alle Probes in diesen Status übergehen, kann es sein, dass die Monitoring-Infrastruktur fehlerhaft ist.
- OK
- Diese Probes sind erfolgreich ohne Fehler gelaufen. Dies ist der gewünschte Status für alle Probes.
- Warnung
- Probes, die ihre WARNUNG-Grenzwerte überschritten haben.
- Kritisch
- Diese Probes haben ihre KRITISCH-Grenzwerte überschritten oder sind aus anderen Gründen in einen kritischen Status übergegangen. (Manche Probes gehen in den Status KRITISCH über, wenn ihr Timeout-Wert überschritten wurde.)
Seien Sie vorsichtig bei der Auswahl der Grenzwerte. Wenn diese überschritten werden, sollten Sie über ein Problem innerhalb Ihrer Infrastruktur benachrichtigt werden. Timeout-Werte werden grundsätzlich in Sekunden eingegeben. Es gibt auch hier Ausnahmen, die in den einzelnen Probe-Referenzen vermerkt sind.
Wichtig
Die Grenzwerte einiger Probes basieren auf Zeit. Hierbei dürfen die Grenzwerte für KRITISCH und WARNUNG nicht eine größere Zeitspanne erlauben, als diejenige, die für den Timeout-Wert gewählt wurde. Andernfalls wird ein Status UNKNOWN in allen Fällen der erweiterten Latenz zurückgegeben, wodurch die Grenzwerte beseitigt werden. Aus diesem Grund wird von Red Hat dringend empfohlen, dass alle Timeout-Werte über die festgelegte Zeitspanne aller zeitabhängigen Grenzwerte hinausgehen.
Lassen Sie Ihre Probes für eine gewisse Zeit lang ohne Benachrichtigungen laufen, um ein Basis-Leistungsverhalten für jedes Ihrer Systeme herzustellen. Obwohl sich die Standardwerte für Probes für Ihre Zwecke eignen können, so hat jede Organisation eine unterschiedliche Umgebung, die eventuell das Abändern der Grenzwerte erforderlich macht.