2.3.11.4. Node Problem Detector (テクノロジープレビュー)
この機能は現在 テクノロジープレビュー として提供されており、実稼働環境のワークロードには適していません。
Node Problem Detector (ノード問題検出機能) は特定の問題を検出し、それらの問題を外部コントローラーがアクションを実行する外部 API サーバーに報告することで、ノードの正常性をモニターします。Node Problem Detector は、各ノードで daemonSet として実行されるデーモンです。このデーモンはクラスターに、ノードをスケジュール対象外とするノードレべルの障害を認識させようとします。Node Problem Detector を起動する際に、これに対して、検出する問題を配信するポートを指定します。Node Problem Detector により、データ収集を行うためにサブデーモンをロードすることができます。現時点は、3 つのサブデーモンを使用できます。問題デーモンによって検出される問題は、 NodeCondition
として分類できます。
以下は 3 つの問題デーモンです。
- カーネルモニター: journald でカーネルログをモニターし、正規表現パターンに基づいて問題を報告します。
- AbrtAdaptor: ノードでカーネルの問題、および journald でアプリケーションのクラッシュをモニターします。
-
CustomerPluginMonitor: 条件の有無をテストできるようにし、条件が満たされない場合には
0
または1
で終了します。
詳細は、Node Problem Detector を参照してください。