11.3.6. 시스템 예약 CPU 사용률이 80% 이상인 노드
시스템 예약 CPU 사용률이 80% 이상인 노드 쿼리는 시스템 예약 CPU 사용률이 80%를 넘는 노드를 식별합니다. 이 쿼리는 지난 5분 동안의 CPU 사용률을 계산하기 위해 시스템에 예약된 용량에 초점을 맞추고 이를 노드에서 사용 가능한 CPU 리소스와 비교합니다. 비율이 80%를 초과하면 노드의 결과가 메트릭에 표시됩니다.
기본 쿼리 예시
sum by (node) (rate(container_cpu_usage_seconds_total{id="/system.slice"}[5m]) * 100) / sum by (node) (kube_node_status_capacity{resource="cpu"} - kube_node_status_allocatable{resource="cpu"}) >= 80
이 쿼리는 리소스 고갈로 이어질 수 있는 시스템 예약 CPU 사용량의 위험 수준을 나타냅니다. 시스템에 예약된 CPU 사용량이 높으면 시스템 프로세스(Kubelet 및 CRI-O 포함)가 노드의 리소스를 적절하게 관리하지 못할 수 있습니다. 이 쿼리는 과도한 시스템 프로세스나 잘못 구성된 CPU 할당을 나타낼 수 있습니다.
가능한 시정 조치로는 다른 노드로 작업 부하를 재분배하거나 노드에 할당된 CPU 리소스를 늘리는 것이 있습니다. 시스템 CPU 사용률이 높은 원인을 조사하고 이상치 , 평균 기간 , 작업 수 범주에서 해당 메트릭을 검토하여 노드 동작에 대한 추가적인 통찰력을 얻으세요.