付録D プローブ
「モニタリング」 で説明されているように、Monitoring のエンタイトルメントが付与されたシステムには健全性と完全な動作性を常に確認できるようプローブを適用することができます。 本付録では Apache などコマンドグループごとに分けて使用できるプローブを一覧にしています。
システムの外部状況を監視するプローブではなく (ネットワークサービス::SSH プローブなど)、 内部状況を監視するプローブ (Linux::ディスク使用のプローブなど) の多くは Red Hat Network Monitoring Daemon (
rhnmd
) のインストールが必要になります。 この要件は各プローブの説明部分に記載されています。
本付録では、 入力が必須となるフィールド (「*」印が付いている)、 デフォルト値、 警報を発するよう設定できるしきい値などについての説明を各プローブごと記載しています。 同様に、 各コマンドグループセクションの冒頭にはそのグループ内の全プローブに該当する内容についての説明があります。 「プローブのガイドライン」 で全般的なガイドラインについて説明し、 以降の各セションでプローブごと詳細に見ていきます。
注記
ほぼすべてのプローブが TCP (Transmission Control Protocol) を転送プロトコルとして使用します。 例外がある場合は、各プローブの説明部分に記載されています。
D.1. プローブのガイドライン リンクのコピーリンクがクリップボードにコピーされました!
リンクのコピーリンクがクリップボードにコピーされました!
全般的なガイドラインでは各プローブの状態の意味について説明し、 プローブにしきい値を設定する方法を見ていきます。
以下の一覧では各プローブの状態の意味を簡単に説明しています。
- 不明 (Unknown)
- プローブの状態の確定に必要な基準が収集できないプローブです。 タイムアウトを過ぎるとほとんどのプローブがこの状態になります (ただし、すべてのプローブが必ずこの状態になるわけではありません)。 また、 この状態のプローブは正しく設定が行われていない可能性があります。
- 待機中 (Pending)
- そのデータが RHN Satellite で受信されていないプローブです。 新規のプローブがこの状態になるのは普通です。 ただし、 全てのプローブがこの状態に陥る場合はモニタリングのインフラストラクチャに障害が発生している可能性があります。
- OK
- エラーがなく正常に稼動しているプローブです。 全てのプローブでこの状態が望ましい状態です。
- 警告
- 警告 (WARNING) のしきい値を超えているプローブです。
- 重大 (Critical)
- 重大 (CRITICAL) のしきい値を越えたプローブ、 または何らかの手段で重大な状態に達したプローブです。 (タイムアウトの期間を越えると重大な状態にあるプローブがいくつかあります)
プローブを追加する場合は有効なしきい値を設定するようにしてください。 このしきい値を越えるとインフラストラクチャ内の問題に対処する管理者などに通知が送信されます。 タイムアウト期間は他に指示がない限り秒単位で入力します。 例外がある場合は、各プローブの説明部分に記載されています。
重要
しきい値が時間に対応するプローブもあります。 「重大」 (CRITICAL) 及び「警告」 (WARNING) のしきい値を意図した通り機能させるためには、 これらの値がタイムアウト期間に割り当てられた時間を超えることはできません。 タイムアウト期間を過ぎるとすべて待ち時間超過となり「不明」 (UNKNOWN) 状態が返されるため、 しきい値を設定する意味がなくなります。 この理由から、 タイムアウト期間は時間を設定するすべてのしきい値より必ず大きい値となることを確認することを Red Hat は強く推奨します。
Red Hat では、しばらくの間は通知なしでプローブを実行して各システムのベースラインパフォーマンスを確立することをお勧めします。 プローブに与えられているデフォルト値がニーズに適している場合もありますが、組織によって環境はそれぞれ異なり、しきい値の変更を要する場合もあります。