5.3.4. 경고 규칙


OpenShift Container Platform 클러스터 모니터링에는 기본적으로 구성된 다음 경고 규칙이 제공됩니다. 현재는 사용자 지정 경고 규칙을 추가할 수 없습니다.

일부 경고 규칙에는 이름이 동일합니다. 이것은 의도적입니다. 임계값이 다르거나 심각도가 다르거나 둘 다 있는 동일한 이벤트에 대해 경고합니다. 억제 규칙을 사용하면 심각도가 더 높은 심각도가 실행되면 더 낮은 심각도가 억제됩니다.

경고 규칙에 대한 자세한 내용은 구성 파일을 참조하십시오.

경고심각도설명

ClusterMonitoringOperatorErrors

심각

Cluster Monitoring Operator에서 X% 오류가 발생했습니다.

AlertmanagerDown

심각

Alertmanager가 Prometheus 대상 검색에서 사라졌습니다.

ClusterMonitoringOperatorDown

심각

ClusterMonitoringOperator가 Prometheus 대상 검색에서 사라졌습니다.

KubeAPIDown

심각

KubeAPI가 Prometheus 대상 검색에서 사라졌습니다.

KubeControllerManagerDown

심각

kubecontrollermanager가 Prometheus 대상 검색에서 사라졌습니다.

KubeSchedulerDown

심각

kubescheduler가 Prometheus 대상 검색에서 사라졌습니다.

KubeStateMetricsDown

심각

KubeStateMetrics는 Prometheus 대상 검색에서 사라졌습니다.

KubeletDown

심각

kubelet이 Prometheus 대상 검색에서 사라졌습니다.

NodeExporterDown

심각

NodeExporter는 Prometheus 대상 검색에서 사라졌습니다.

PrometheusDown

심각

Prometheus는 Prometheus 대상 검색에서 사라졌습니다.

PrometheusOperatorDown

심각

prometheusOperator는 Prometheus 대상 검색에서 사라졌습니다.

KubePodCrashLooping

심각

네임스페이스/포드 (컨테이너)가 재시작 시간 / 초

KubePodNotReady

심각

네임 스페이스/Pod 가 준비되지 않았습니다.

KubeDeploymentGenerationMismatch

심각

배포 네임 스페이스/배포 생성 불일치

KubeDeploymentReplicasMismatch

심각

배포 네임 스페이스/배포 복제본 불일치

KubeStatefulSetReplicasMismatch

심각

StatefulSet 네임 스페이스/StatefulSet 복제본 불일치

KubeStatefulSetGenerationMismatch

심각

StatefulSet 네임 스페이스/StatefulSet 생성 불일치

KubeDaemonSetRolloutStuck

심각

원하는 Pod의 X%만 예약되고 데몬 세트 네임 스페이스/DaemonSet준비가 완료되었습니다.

KubeDaemonSetNotScheduled

경고

daemonset 네임스페이스/DaemonSet 의 여러 Pod는 예약되지 않습니다.

KubeDaemonSetMisScheduled

경고

데몬 세트 네임스페이스/DaemonSet 의 여러 Pod가 실행되지 않아야 하는 위치입니다.

KubeCronJobRunning

경고

CronJob 네임스페이스/CronJob 은 완료하는 데 1시간 이상 걸립니다.

KubeJobCompletion

경고

작업 네임스페이스/Job 을 완료하는 데 1시간 이상 걸립니다.

KubeJobFailed

경고

작업 네임스페이스/Job 을 완료하지 못했습니다.

KubeCPUOvercommit

경고

Pod에서 과다 할당된 CPU 리소스 요청은 노드 오류를 허용하지 않습니다.

KubeMemOvercommit

경고

Pod에서 과다 할당된 메모리 리소스 요청은 노드 오류를 허용하지 않습니다.

KubeCPUOvercommit

경고

네임스페이스에서 과다 할당된 CPU 리소스 요청 할당량입니다.

KubeMemOvercommit

경고

네임스페이스에서 과다 할당된 메모리 리소스 요청 할당량입니다.

alerKubeQuotaExceeded

경고

네임스페이스 네임스페이스에서 리소스의 X% 사용.

KubePersistentVolumeUsageCritical

심각

네임스페이스에서 PersistentVolumeClaim 이 클레임한 영구 볼륨은 X% 사용 가능합니다.

KubePersistentVolumeFullInFourDays

심각

최근 샘플링에 따라 네임스페이스에서 PersistentVolumeClaim에서 클레임 한 영구 볼륨은 4일 내에 채워질 것으로 예상됩니다. 현재 X 바이트를 사용할 수 있습니다.

KubeNodeNotReady

경고

노드 가 1시간 이상 준비되지 않았습니다

KubeVersionMismatch

경고

X 버전의 Kubernetes 구성 요소가 실행되고 있습니다.

KubeClientErrors

경고

Kubernetes API 서버 클라이언트 '작업/인스턴스'에 X% 오류가 발생했습니다.

KubeClientErrors

경고

Kubernetes API 서버 클라이언트 '작업/인스턴스'에 X 오류/초가 발생했습니다.

KubeletTooManyPods

경고

kubelet 인스턴스는 110개 제한에 가까운 X Pod를 실행하고 있습니다.

KubeAPILatencyHigh

경고

API 서버에는 Verb ResourceX 초의 99번째 백분위 대기 시간이 있습니다.

KubeAPILatencyHigh

심각

API 서버에는 Verb ResourceX 초의 99번째 백분위 대기 시간이 있습니다.

KubeAPIErrorsHigh

심각

API 서버가 요청의 X%에 대해 오류가 발생했습니다.

KubeAPIErrorsHigh

경고

API 서버가 요청의 X%에 대해 오류가 발생했습니다.

KubeClientCertificateExpiration

경고

Kubernetes API 인증서가 7일 이내에 만료됩니다.

KubeClientCertificateExpiration

심각

Kubernetes API 인증서가 1일 이내에 만료됩니다.

AlertmanagerConfigInconsistent

심각

요약: 동기화되지 않은 구성. 설명: Alertmanager 클러스터 서비스의 인스턴스 구성이 동기화되지 않았습니다.

AlertmanagerFailedReload

경고

요약: Alertmanager의 설정을 다시 로드하지 못했습니다. 설명: Alertmanager 설정을 다시 로드하지 못했습니다. Namespace/Pod 에 실패했습니다.

TargetDown

경고

요약: 대상은 다운됩니다. 설명: 작업 대상의 X%가 다운되었습니다.

DeadMansSwitch

none

요약: 경고 DeadMansSwitch. 설명: DeadMansSwitch는 전체 경고 파이프라인이 작동하는지 확인합니다.

NodeDiskRunningFull

경고

노드 내보내기 네임스페이스/Pod장치 장치가 다음 24시간 내에 완전히 실행됩니다.

NodeDiskRunningFull

심각

다음 2시간 내에 node -exporter 네임스페이스/Pod장치 장치가 완전히 실행됩니다.

PrometheusConfigReloadFailed

경고

요약: Prometheus 구성을 다시 로드하지 못했습니다. 설명: Namespace/Pod에 대해 Prometheus 구성을 다시 로드하지 못했습니다

PrometheusNotificationQueueRunningFull

경고

요약: Prometheus의 경고 알림 대기열이 완전히 실행됩니다. 설명: Prometheus의 경고 알림 대기열이 네임 스페이스/Pod에 대해 전체 실행 중입니다

PrometheusErrorSendingAlerts

경고

요약: Prometheus에서 경고를 보내는 동안 오류가 발생했습니다. 설명: Prometheus 네임스페이스/Pod 에서 Alertmanager로 경고를 보내는 동안 오류 발생

PrometheusErrorSendingAlerts

심각

요약: Prometheus에서 경고를 보내는 동안 오류가 발생했습니다. 설명: Prometheus 네임스페이스/Pod 에서 Alertmanager로 경고를 보내는 동안 오류 발생

PrometheusNotConnectedToAlertmanagers

경고

요약: Prometheus는 Alertmanagers에 연결되어 있지 않습니다. 설명: Prometheus 네임 스페이스/Pod 가 Alertmanagers에 연결되어 있지 않습니다

PrometheusTSDBReloadsFailing

경고

요약: Prometheus는 디스크에서 데이터 블록을 다시 로드하는 데 문제가 있습니다. 설명: 인스턴스의 작업에 지난 4시간 동안 X 다시 로드 오류가 발생했습니다.

PrometheusTSDBCompactionsFailing

경고

요약: Prometheus는 샘플 블록을 압축하는 데 문제가 있습니다. 설명: 인스턴스의 작업에 지난 4시간 동안 X 압축 오류가 발생했습니다.

PrometheusTSDBWALCorruptions

경고

요약: Prometheus write-ahead 로그가 손상되었습니다. 설명: 인스턴스의 작업에 는 WAL( write-ahead) 로그가 손상되었습니다.

PrometheusNotIngestingSamples

경고

요약: Prometheus는 샘플을 수집하지 않습니다. 설명: Prometheus 네임스페이스/Pod 가 샘플을 수집하지 않습니다.

PrometheusTargetScrapesDuplicate

경고

요약: Prometheus에는 거부된 많은 샘플이 있습니다. 설명: 네임스페이스/Pod 에는 중복 타임스탬프로 인해 거부되지만 다른 값이 있습니다.

EtcdInsufficientMembers

심각

etcd 클러스터 "Job": insufficient members(X).

EtcdNoLeader

심각

etcd 클러스터 "작업": 멤버 인스턴스는 리더가 없습니다.

EtcdHighNumberOfLeaderChanges

경고

etcd 클러스터 "작업": 인스턴스 인스턴스는 지난 1 시간 이내에 X 리더 변경 사항을 보았습니다.

EtcdHighNumberOfFailedGRPCRequests

경고

etcd 클러스터 "작업": etcd 인스턴스 인스턴스에서 GRPC_Method 에 대한 요청의 x%가 실패했습니다.

EtcdHighNumberOfFailedGRPCRequests

심각

etcd 클러스터 "작업": etcd 인스턴스 인스턴스에서 GRPC_Method 에 대한 요청의 x%가 실패했습니다.

EtcdGRPCRequestsSlow

심각

etcd 클러스터 "작업": GRPC_Method 에 대한 gRPC 요청은 etcd 인스턴스 _Instance에서 X_s를 가져옵니다.

EtcdMemberCommunicationSlow

경고

etcd 클러스터 "작업": To 와 멤버 통신이 etcd 인스턴스 _Instance에서 X_s를 가져옵니다.

EtcdHighNumberOfFailedProposals

경고

etcd 클러스터 "작업": etcd 인스턴스 인스턴스의 마지막 1시간 내에 제안 오류가 발생합니다.

EtcdHighFsyncDurations

경고

etcd 클러스터 "작업": 99번째 백분율 fync 기간은 etcd 인스턴스에서 X_s입니다. _Instance.

EtcdHighCommitDurations

경고

etcd 클러스터 "작업": etcd 인스턴스에서 X_s의 99번째 백분위 커밋 기간(_I) _Instance.

FdExhaustionClose

경고

작업 인스턴스 인스턴스에서 파일 설명자가 곧 소진됩니다

FdExhaustionClose

심각

작업 인스턴스 인스턴스에서 파일 설명자가 곧 소진됩니다

Red Hat logoGithubRedditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

© 2024 Red Hat, Inc.