26.2. Node Problem Detector 출력 예
다음 예제에서는 특정 노드에서 커널 교착 상태의 Node Problem Detector 감시의 출력을 보여줍니다. 명령은 oc get node
를 사용하여 로그에서 KernelDeadlock
항목에 대한 특정 노드 필터링을 확인합니다.
# oc get node <node> -o yaml | grep -B5 KernelDeadlock
문제 없는 샘플 Node Problem Detector 출력
message: kernel has no deadlock reason: KernelHasNoDeadlock status: false type: KernelDeadLock
KernelDeadLock 상태의 출력 예
message: task docker:1234 blocked for more than 120 seconds reason: DockerHung status: true type: KernelDeadLock
이 예에서는 노드의 이벤트를 위한 Node Problem Detector 감시의 출력을 보여줍니다. 다음 명령은 Node Problem Detector 구성 맵 의
이벤트를 사용합니다.
kernel-monitor.json
섹션에 나열된 이벤트를 기본 프로젝트 감시에 대해 oc get
# oc get event -n default --field-selector=source=kernel-monitor --watch
노드에서 이벤트를 표시하는 샘플 출력
LAST SEEN FIRST SEEN COUNT NAME KIND SUBOBJECT TYPE REASON SOURCE MESSAGE 2018-06-27 09:08:27 -0400 EDT 2018-06-27 09:08:27 -0400 EDT 1 my-node1 node Warning TaskHunk kernel-monitor.my-node1 docker:1234 blocked for more than 300 seconds 2018-06-27 09:08:27 -0400 EDT 2018-06-27 09:08:27 -0400 EDT 3 my-node2 node Warning KernelOops kernel-monitor.my-node2 BUG: unable to handle kernel NULL pointer deference at nowhere 2018-06-27 09:08:27 -0400 EDT 2018-06-27 09:08:27 -0400 EDT 1 my-node1 node Warning KernelOops kernel-monitor.my-node2 divide error 0000 [#0] SMP
Node Problem Detector는 리소스를 사용합니다. Node Problem Detector를 사용하는 경우 클러스터 성능의 균형을 조정할 수 있는 충분한 노드가 있는지 확인합니다.