付録A プローブ
Monitoring のエンタイトルメントが付与されたシステムには健全性と完全な動作性を常に確認できるようにプローブを適用することができます。本セクションでは Apache などのコマンドグループごとに分けて使用できるプローブを一覧にしています。
システムの外部状況を監視するプローブではなく (ネットワークサービス::SSH プローブなど)、内部状況を監視するプローブ (Linux::ディスク使用のプローブなど) の多くは Red Hat Network モニタリングデーモン (
rhnmd
) のインストールが必要になります。この要件は各プローブの説明部分に記載されています。
本セクションでは、入力が必須となるフィールド (「*」印が付いている)、デフォルト値、および警報を発するよう設定できるしきい値などについての説明を各プローブごと記載しています。同様に、各コマンドグループセクションの冒頭にはそのグループ内の全プローブに該当する内容についての説明があります。「プローブのガイドライン」 で全般的なガイドラインについて説明し、以降の各セションでプローブごと詳細に見ていきます。
注記
ほぼすべてのプローブが TCP (Transmission Control Protocol) を転送プロトコルとして使用します。例外がある場合は、各プローブの説明部分に記載されています。
A.1. プローブのガイドライン リンクのコピーリンクがクリップボードにコピーされました!
リンクのコピーリンクがクリップボードにコピーされました!
全般的なガイドラインでは各プローブの状態の意味について説明し、プローブにしきい値を設定する方法を見ていきます。
以下の一覧では各プローブの状態の意味を簡単に説明しています。
- 不明
- プローブの状態の確定に必要な基準が収集できないプローブです。タイムアウトを過ぎるとほとんどのプローブがこの状態になります (ただし、すべてのプローブが必ずこの状態になるわけではありません)。また、この状態のプローブは正しく設定が行われていない可能性があります。
- 待機中 (Pending)
- そのデータが Red Hat Satellite で受信されていないプローブです。新規のプローブがこの状態になるのは普通です。ただし、全てのプローブがこの状態に移行する場合はモニタリングのインフラストラクチャに障害が発生している可能性があります。
- OK
- エラーがなく正常に稼動しているプローブです。全てのプローブでこの状態が望ましい状態です。
- 警告
- 警告 (WARNING) のしきい値を超えているプローブです。
- 危険
- 重大 (CRITICAL) のしきい値を越えたプローブ、または何らかの手段で重大な状態に達したプローブです。(タイムアウトの期間を越えると重大な状態にあるプローブがいくつかあります)
プローブを追加する場合は有効なしきい値を設定するようにしてください。このしきい値を越えるとインフラストラクチャ内の問題に対処する管理者などに通知が送信されます。 タイムアウト期間は他に指示がない限り秒単位で入力します。例外がある場合は、各プローブの説明部分に記載されます。
重要
しきい値が時間に対応するプローブもあります。「重大」 (CRITICAL) および「警告」 (WARNING) のしきい値を意図した通りに機能させるには、これらの値がタイムアウト期間に割り当てられた時間を超えることはできません。タイムアウト期間を過ぎるとすべて待ち時間超過となり「不明」 (UNKNOWN) 状態が返されるため、しきい値を設定する意味がなくなります。この理由から、タイムアウト期間は時間を設定するすべてのしきい値より必ず大きい値となるようにすることを Red Hat は強く推奨します。
しばらくの間は通知なしでプローブを実行して各システムのベースラインパフォーマンスを確立します。プローブに指定されるデフォルト値がニーズに適している場合もありますが、組織によって環境はそれぞれ異なり、しきい値の変更が必要になる場合もあります。