付録C プローブ
「モニターリング —
」 で説明されているように、監視資格のあるシステムには、正常性と完全な操作性を常に確認するプローブを適用できます。この付録では、使用可能なプローブを、Apache などのコマンドグループ別に分類して一覧表示します。

外部側面 (Network Services::SSH プローブなど) ではなく内部システム側面 (Linux::Disk Usage プローブなど) を監視する多くのプローブでは、Red Hat Network Monitoring Daemon (
rhnmd
) のインストールが必要です。この要件は、個々のプローブリファレンスに記載されています。
各プローブには、必須フィールド (* でマークされている)、デフォルト値、およびアラートをトリガーするために設定できるしきい値を識別する独自のリファレンスがこの付録にあります。同様に、各コマンドグループのセクションの先頭には、そのグループ内のすべてのプローブに適用可能な情報が含まれています。「プローブのガイドライン」 一般的なガイドラインをカバーしています。残りのセクションでは、個々のプローブを調べます。
注記
ほとんどすべてのプローブは、トランスポートプロトコルとして 伝送制御プロトコル (TCP) を使用します。これに対する例外は、個々のプローブリファレンス内に記載されています。
C.1. プローブのガイドライン
次の一般的なガイドラインでは、各プローブ状態の意味を概説し、プローブのしきい値を設定する際のガイダンスを提供します。
次のリストは、各プローブ状態の意味を簡単に説明したものです。
- Unknown
- プローブの状態を判断するために必要なメトリックを収集できないプローブ。ほとんどの (すべてではありませんが) プローブは、タイムアウト期間を超えるとこの状態に入ります。この状態のプローブも、正しく設定されていない可能性があります。
- Pending
- RHN Satellite Server がデータを受信していないプローブ。新しいプローブがこの状態になるのは正常です。ただし、すべてのプローブがこの状態になると、監視インフラストラクチャーに障害が発生している可能性があります。
- OK
- エラーなしで正常に実行されたプローブ。これは、すべてのプローブの望ましい状態です。
- Warning
- WARNING しきい値を超えたプローブ。
- Critical
- CRITICAL しきい値を超えたか、他の手段によってクリティカルステータスに達したプローブ。(一部のプローブは、タイムアウト期間を超えるとクリティカルになります。)
プローブを追加するときは、意味のあるしきい値を選択してください。これを超えると、インフラストラクチャー内の問題が自分と管理者に通知されます。特に指定がない限り、タイムアウト時間は秒単位で入力します。これらの規則の例外は、個々のプローブリファレンス内に記載されています。
重要
一部のプローブには、時間に基づくしきい値があります。このような CRITICAL および WARNING しきい値が意図したとおりに機能するためには、それらの値がタイムアウト期間に割り当てられた時間を超えることはできません。それ以外の場合、延長された遅延のすべてのインスタンスで UNKNOWN ステータスが返されるため、しきい値が無効になります。このため、Red Hat は、タイムアウト期間がすべての時間制限しきい値を超えていることを確認することを強くお勧めします。
Red Hat では、各システムのベースラインパフォーマンスを確立するために、しばらくの間、通知なしでプローブを実行することを推奨しています。プローブに提供されているデフォルト値はニーズに合っている場合がありますが、すべての組織には異なる環境があり、しきい値の変更が必要になる場合があります。