Anhang D. Probes
Wie in Abschnitt 4.10, »Monitoring« beschrieben, stellen Probes für Monitoring-berechtigte Systeme sicher, dass sich Ihre Systeme in einwandfreiem Zustand befinden und voll betriebsfähig sind. Dieser Anhang listet die verfügbaren Probes auf, die nach von Befehlsgruppen (wie beispielsweise Apache) unterteilt sind.
Viele Probes, die interne Aspekte Ihres Systems überwachen (wie beispielsweise die Linux::Disk Usage Probe) statt externe Aspekte (wie beispielsweise die Network Services::SSH Probe), erfordern die Installation des Red Hat Network Monitoring Daemon (
rhnmd
). Diese Anforderung ist in der individuellen Probe-Referenz vermerkt.
Jeder Probe hat seine eigene Referenz in diesem Anhang, in der die erforderlichen Felder (markiert mit *), Standardwerte und die Grenzwerte zum Auslösen von Warnmeldungen identifiziert werden. Zu Beginn eines jeden Abschnitts der unterschiedlichen Befehlsgruppen sind Informationen aufgeführt, die auf alle Probes in dieser Gruppe zutreffen. Abschnitt Abschnitt D.1, »Probe-Richtlinien« deckt allgemeine Richtlinien ab. Die verbleibenden Abschnitte befassen sich mit individuellen Probes.
Anmerkung
Beinahe alle Probes verwenden das Transmission Control Protocol (TCP) als Transportprotokoll. Ausnahmen davon werden eigens in den Referenzen der jeweiligen Probes angegeben.
D.1. Probe-Richtlinien Link kopierenLink in die Zwischenablage kopiert!
Link kopierenLink in die Zwischenablage kopiert!
Die folgenden allgemeinen Richtlinien umreißen die Bedeutung eines jeden Probe-Status und stellen eine Anleitung zur Festlegung von Grenzwerten dar.
Die folgende Liste liefert eine kurze Beschreibung der Bedeutung eines jeden Probes-Status:
- Unbekannt
- Diese Probes können die Messdaten nicht sammeln, die zur Bestimmung des Probe-Status benötigt werden. Die meisten Probes, wenn auch nicht alle, gehen in diesen Status über, wenn ihr Timeout-Wert überschritten wird. Probes mit diesem Status sind unter Umständen nicht korrekt konfiguriert.
- Ausstehend
- Für diese Probes hat der RHN Satellite noch keine Daten erhalten. Es ist normal, dass sich neue Probes in diesem Status befinden. Wenn jedoch alle Probes in diesen Status übergehen, kann es sein, dass Ihre Monitoring-Infrastruktur fehlerhaft ist.
- OK
- Diese Probes sind erfolgreich ohne Fehler abgelaufen. Dies ist der gewünschte Status für alle Probes.
- Warnung
- Diese Probes haben ihre WARNUNG-Grenzwerte überschritten.
- Kritisch
- Diese Probes haben ihre KRITISCH-Grenzwerte überschritten oder sind aus anderen Gründen in einen kritischen Status übergegangen. (Manche Probes gehen in den Status KRITISCH über, wenn ihr Timeout-Wert überschritten wurde.)
Seien Sie vorsichtig bei der Auswahl der Grenzwerte. Wenn diese überschritten werden, sollten Sie über ein Problem innerhalb Ihrer Infrastruktur benachrichtigt werden. Timeout-Werte werden grundsätzlich in Sekunden eingegeben. Es gibt auch hier Ausnahmen, die in den einzelnen Probe-Referenzen vermerkt sind.
Wichtig
Die Grenzwerte einiger Probes basieren auf Zeit. Hierbei dürfen die Grenzwerte für KRITISCH und WARNUNG nicht eine größere Zeitspanne erlauben, als diejenige, die für den Timeout-Wert gewählt wurde. Ansonsten erhalten Sie in allen Fällen den Status UNBEKANNT. Aus diesem Grund wird von Red Hat dringend empfohlen, dass alle Timeout-Werte über die festgelegte Zeitspanne aller zeitabhängigen Grenzwerte hinausgehen.
Denken Sie daran, dass von Red Hat empfohlen wird, Ihre Probes für eine gewisse Zeit lang ohne Benachrichtigungen ablaufen zu lassen, um ein Basisleistungsverhalten für jedes Ihrer Systeme festzulegen. Obwohl sich die Standardwerte für Probes für Ihre Zwecke eignen können, so hat jede Organisation eine unterschiedliche Umgebung, die eventuell das Abändern der Grenzwerte erforderlich macht.