5.3.4. 경고 규칙
OpenShift Container Platform 클러스터 모니터링에는 기본적으로 구성된 다음 경고 규칙이 제공됩니다. 현재는 사용자 지정 경고 규칙을 추가할 수 없습니다.
일부 경고 규칙에는 이름이 동일합니다. 이것은 의도적입니다. 임계값이 다르거나 심각도가 다르거나 둘 다 있는 동일한 이벤트에 대해 경고합니다. 억제 규칙을 사용하면 심각도가 더 높은 심각도가 실행되면 더 낮은 심각도가 억제됩니다.
경고 규칙에 대한 자세한 내용은 구성 파일을 참조하십시오.
경고 | 심각도 | 설명 |
---|---|---|
|
| Cluster Monitoring Operator에서 X% 오류가 발생했습니다. |
|
| Alertmanager가 Prometheus 대상 검색에서 사라졌습니다. |
|
| ClusterMonitoringOperator가 Prometheus 대상 검색에서 사라졌습니다. |
|
| KubeAPI가 Prometheus 대상 검색에서 사라졌습니다. |
|
| kubecontrollermanager가 Prometheus 대상 검색에서 사라졌습니다. |
|
| kubescheduler가 Prometheus 대상 검색에서 사라졌습니다. |
|
| KubeStateMetrics는 Prometheus 대상 검색에서 사라졌습니다. |
|
| kubelet이 Prometheus 대상 검색에서 사라졌습니다. |
|
| NodeExporter는 Prometheus 대상 검색에서 사라졌습니다. |
|
| Prometheus는 Prometheus 대상 검색에서 사라졌습니다. |
|
| prometheusOperator는 Prometheus 대상 검색에서 사라졌습니다. |
|
| 네임스페이스/포드 (컨테이너)가 재시작 시간 / 초 |
|
| 네임 스페이스/Pod 가 준비되지 않았습니다. |
|
| 배포 네임 스페이스/배포 생성 불일치 |
|
| 배포 네임 스페이스/배포 복제본 불일치 |
|
| StatefulSet 네임 스페이스/StatefulSet 복제본 불일치 |
|
| StatefulSet 네임 스페이스/StatefulSet 생성 불일치 |
|
| 원하는 Pod의 X%만 예약되고 데몬 세트 네임 스페이스/DaemonSet준비가 완료되었습니다. |
|
| daemonset 네임스페이스/DaemonSet 의 여러 Pod는 예약되지 않습니다. |
|
| 데몬 세트 네임스페이스/DaemonSet 의 여러 Pod가 실행되지 않아야 하는 위치입니다. |
|
| CronJob 네임스페이스/CronJob 은 완료하는 데 1시간 이상 걸립니다. |
|
| 작업 네임스페이스/Job 을 완료하는 데 1시간 이상 걸립니다. |
|
| 작업 네임스페이스/Job 을 완료하지 못했습니다. |
|
| Pod에서 과다 할당된 CPU 리소스 요청은 노드 오류를 허용하지 않습니다. |
|
| Pod에서 과다 할당된 메모리 리소스 요청은 노드 오류를 허용하지 않습니다. |
|
| 네임스페이스에서 과다 할당된 CPU 리소스 요청 할당량입니다. |
|
| 네임스페이스에서 과다 할당된 메모리 리소스 요청 할당량입니다. |
|
| 네임스페이스 네임스페이스에서 리소스의 X% 사용. |
|
| 네임스페이스에서 PersistentVolumeClaim 이 클레임한 영구 볼륨은 X% 가 사용 가능합니다. |
|
| 최근 샘플링에 따라 네임스페이스에서 PersistentVolumeClaim에서 클레임 한 영구 볼륨은 4일 내에 채워질 것으로 예상됩니다. 현재 X 바이트를 사용할 수 있습니다. |
|
| 노드 가 1시간 이상 준비되지 않았습니다 |
|
| X 버전의 Kubernetes 구성 요소가 실행되고 있습니다. |
|
| Kubernetes API 서버 클라이언트 '작업/인스턴스'에 X% 오류가 발생했습니다. |
|
| Kubernetes API 서버 클라이언트 '작업/인스턴스'에 X 오류/초가 발생했습니다. |
|
| kubelet 인스턴스는 110개 제한에 가까운 X Pod를 실행하고 있습니다. |
|
| API 서버에는 Verb Resource 의 X 초의 99번째 백분위 대기 시간이 있습니다. |
|
| API 서버에는 Verb Resource 의 X 초의 99번째 백분위 대기 시간이 있습니다. |
|
| API 서버가 요청의 X%에 대해 오류가 발생했습니다. |
|
| API 서버가 요청의 X%에 대해 오류가 발생했습니다. |
|
| Kubernetes API 인증서가 7일 이내에 만료됩니다. |
|
| Kubernetes API 인증서가 1일 이내에 만료됩니다. |
|
|
요약: 동기화되지 않은 구성. 설명: Alertmanager 클러스터 |
|
| 요약: Alertmanager의 설정을 다시 로드하지 못했습니다. 설명: Alertmanager 설정을 다시 로드하지 못했습니다. Namespace/Pod 에 실패했습니다. |
|
| 요약: 대상은 다운됩니다. 설명: 작업 대상의 X%가 다운되었습니다. |
|
| 요약: 경고 DeadMansSwitch. 설명: DeadMansSwitch는 전체 경고 파이프라인이 작동하는지 확인합니다. |
|
| 노드 내보내기 네임스페이스/Pod 의 장치 장치가 다음 24시간 내에 완전히 실행됩니다. |
|
| 다음 2시간 내에 node -exporter 네임스페이스/Pod 의 장치 장치가 완전히 실행됩니다. |
|
| 요약: Prometheus 구성을 다시 로드하지 못했습니다. 설명: Namespace/Pod에 대해 Prometheus 구성을 다시 로드하지 못했습니다 |
|
| 요약: Prometheus의 경고 알림 대기열이 완전히 실행됩니다. 설명: Prometheus의 경고 알림 대기열이 네임 스페이스/Pod에 대해 전체 실행 중입니다 |
|
| 요약: Prometheus에서 경고를 보내는 동안 오류가 발생했습니다. 설명: Prometheus 네임스페이스/Pod 에서 Alertmanager로 경고를 보내는 동안 오류 발생 |
|
| 요약: Prometheus에서 경고를 보내는 동안 오류가 발생했습니다. 설명: Prometheus 네임스페이스/Pod 에서 Alertmanager로 경고를 보내는 동안 오류 발생 |
|
| 요약: Prometheus는 Alertmanagers에 연결되어 있지 않습니다. 설명: Prometheus 네임 스페이스/Pod 가 Alertmanagers에 연결되어 있지 않습니다 |
|
| 요약: Prometheus는 디스크에서 데이터 블록을 다시 로드하는 데 문제가 있습니다. 설명: 인스턴스의 작업에 는 지난 4시간 동안 X 다시 로드 오류가 발생했습니다. |
|
| 요약: Prometheus는 샘플 블록을 압축하는 데 문제가 있습니다. 설명: 인스턴스의 작업에 는 지난 4시간 동안 X 압축 오류가 발생했습니다. |
|
| 요약: Prometheus write-ahead 로그가 손상되었습니다. 설명: 인스턴스의 작업에 는 WAL( write-ahead) 로그가 손상되었습니다. |
|
| 요약: Prometheus는 샘플을 수집하지 않습니다. 설명: Prometheus 네임스페이스/Pod 가 샘플을 수집하지 않습니다. |
|
| 요약: Prometheus에는 거부된 많은 샘플이 있습니다. 설명: 네임스페이스/Pod 에는 중복 타임스탬프로 인해 거부되지만 다른 값이 있습니다. |
|
| etcd 클러스터 "Job": insufficient members(X). |
|
| etcd 클러스터 "작업": 멤버 인스턴스는 리더가 없습니다. |
|
| etcd 클러스터 "작업": 인스턴스 인스턴스는 지난 1 시간 이내에 X 리더 변경 사항을 보았습니다. |
|
| etcd 클러스터 "작업": etcd 인스턴스 인스턴스에서 GRPC_Method 에 대한 요청의 x%가 실패했습니다. |
|
| etcd 클러스터 "작업": etcd 인스턴스 인스턴스에서 GRPC_Method 에 대한 요청의 x%가 실패했습니다. |
|
| etcd 클러스터 "작업": GRPC_Method 에 대한 gRPC 요청은 etcd 인스턴스 _Instance에서 X_s를 가져옵니다. |
|
| etcd 클러스터 "작업": To 와 멤버 통신이 etcd 인스턴스 _Instance에서 X_s를 가져옵니다. |
|
| etcd 클러스터 "작업": etcd 인스턴스 인스턴스의 마지막 1시간 내에 제안 오류가 발생합니다. |
|
| etcd 클러스터 "작업": 99번째 백분율 fync 기간은 etcd 인스턴스에서 X_s입니다. _Instance. |
|
| etcd 클러스터 "작업": etcd 인스턴스에서 X_s의 99번째 백분위 커밋 기간(_I) _Instance. |
|
| 작업 인스턴스 인스턴스에서 파일 설명자가 곧 소진됩니다 |
|
| 작업 인스턴스 인스턴스에서 파일 설명자가 곧 소진됩니다 |