26.5. Node Problem Detector が実行中であることの確認
Node Problem Detector が有効であることを確認するには、以下を実行します。
以下のコマンドを実行し、Problem Node Detector Pod の名前を取得します。
# oc get pods -n openshift-node-problem-detector NAME READY STATUS RESTARTS AGE node-problem-detector-8z8r8 1/1 Running 0 1h node-problem-detector-nggjv 1/1 Running 0 1h
以下のコマンドを実行し、Problem Node Detector Pod のログ情報を表示します。
# oc logs -n openshift-node-problem-detector <pod_name>
出力は以下のようになります。
# oc logs -n openshift-node-problem-detector node-problem-detector-c6kng I0416 23:22:00.641354 1 log_monitor.go:63] Finish parsing log monitor config file: {WatcherConfig:{Plugin:journald PluginConfig:map[source:kernel] LogPath:/host/log/journal Lookback:5m} BufferSize:10 Source:kernel-monitor DefaultConditions:[{Type:KernelDeadlock Status:false Transition:0001-01-01 00:00:00 +0000 UTC Reason:KernelHasNoDeadlock Message:kernel has no deadlock}]
ノードのイベントをシミュレーションして Node Problem Detector をテストします。
# echo "kernel: divide error: 0000 [#0] SMP." >> /dev/kmsg
ノードの状態をシミュレーションして Node Problem Detector をテストします。
# echo "kernel: task docker:7 blocked for more than 300 seconds." >> /dev/kmsg