2.3.11.4. Node Problem Detector(기술 프리뷰)
이 기능은 현재 기술 프리뷰 에 있으며 프로덕션 워크로드에는 적합하지 않습니다.
Node Problem Detector는 특정 문제를 찾고 이러한 문제를 API 서버에 보고하여 노드의 상태를 모니터링합니다. 이 경우 외부 컨트롤러가 조치를 취할 수 있습니다. Node Problem Detector는 각 노드에서 DaemonSet으로 실행되는 데몬입니다. 데몬은 노드를 예약할 수 없도록 해야 하는 노드 수준 오류를 클러스터에서 확인하려고 합니다. Node Problem Detector를 시작하면 발견된 문제를 브로드캐스트해야 하는 포트를 알려줍니다. 하위 데몬을 로드하여 데이터 수집을 수행할 수 있습니다. 현재 3가지가 있습니다. 문제 데몬에서 발견한 문제는 NodeCondition
으로 분류할 수 있습니다.
세 가지 문제 데몬은 다음과 같습니다.
- 커널 모니터: journald를 통해 커널 로그를 모니터링하고 regex 패턴에 따라 문제를 보고합니다.
- AbrtAdaptor: journald에서 커널 문제 및 애플리케이션 충돌을 위해 노드를 모니터링합니다.
-
CustomerPluginMonitor - 조건을 테스트하고
0
또는1
을 종료할 수 있습니다.
자세한 내용은 Node Problem Detector 를 참조하십시오.