5.3.4. アラートルール

OpenShift Container Platform Cluster Monitoring には、デフォルトで設定される以下のアラートルールが同梱されます。現時点で、カスタムアラートルールを追加することはできません。

一部のアラートルールには同じ名前が付けられています。これは意図的な理由によるものです。これらのルールは、それぞれのしきい値、それぞれの重大度 (severity) またはそれらの両方を使って同じイベントについてのアラートを送ります。抑制ルールを使用すると、高い重大度のアラートが発生する場合に重大度の低いアラートが抑制されます。

アラートルールについての詳細は、configuration file を参照してください。

Expand

アラート	重要度	説明
`ClusterMonitoringOperatorErrors`	`critical`	Cluster Monitoring Operator で X% エラーが発生している。
`AlertmanagerDown`	`critical`	Alertmanager が Prometheus のターゲット検出に表示されない。
`ClusterMonitoringOperatorDown`	`critical`	ClusterMonitoringOperator が Prometheus のターゲット検出に表示されない。
`KubeAPIDown`	`critical`	KubeAPI が Prometheus のターゲット検出に表示されない。
`KubeControllerManagerDown`	`critical`	KubeControllerManager が Prometheus のターゲット検出に表示されない。
`KubeSchedulerDown`	`critical`	KubeScheduler が Prometheus のターゲット検出に表示されない。
`KubeStateMetricsDown`	`critical`	KubeStateMetrics が Prometheus のターゲット検出に表示されない。
`KubeletDown`	`critical`	Kubelet が Prometheus のターゲット検出に表示されない。
`NodeExporterDown`	`critical`	NodeExporter が Prometheus のターゲット検出に表示されない。
`PrometheusDown`	`critical`	Prometheus が Prometheus のターゲット検出に表示されない。
`PrometheusOperatorDown`	`critical`	PrometheusOperator が Prometheus のターゲット検出に表示されない。
`KubePodCrashLooping`	`critical`	Namespace/Pod (コンテナー) が再起動している (回数 / 秒)。
`KubePodNotReady`	`critical`	Namespace/Pod の準備ができていない。
`KubeDeploymentGenerationMismatch`	`critical`	デプロイメント Namespace/Deployment 生成の不一致。
`KubeDeploymentReplicasMismatch`	`critical`	デプロイメント Namespace/Deployment レプリカの不一致。
`KubeStatefulSetReplicasMismatch`	`critical`	StatefulSet Namespace/StatefulSet レプリカの不一致。
`KubeStatefulSetGenerationMismatch`	`critical`	StatefulSet Namespace/StatefulSet 生成の不一致。
`KubeDaemonSetRolloutStuck`	`critical`	必要な Pod の X% のみがスケジュールされており、daemon set Namespace/DaemonSet に対して準備ができている。
`KubeDaemonSetNotScheduled`	`warning`	daemonset Namespace/DaemonSet の多数の Pod がスケジュールされていない。
`KubeDaemonSetMisScheduled`	`warning`	daemonset Namespace/DaemonSet の多数の Pod が実行される場所ではない場所で実行されている。
`KubeCronJobRunning`	`warning`	CronJob Namespace/CronJob の完了に 1 時間を超える時間がかかる。
`KubeJobCompletion`	`warning`	ジョブ Namespaces/Job の完了に 1 時間を超える時間がかかる。
`KubeJobFailed`	`warning`	ジョブ Namespaces/Job を完了できない。
`KubeCPUOvercommit`	`warning`	Pod でのオーバーコミットされた CPU リソース要求がノードの失敗を許容できない。
`KubeMemOvercommit`	`warning`	Pod でのオーバーコミットされたメモリーリソース要求がノードの失敗を許容できない。
`KubeCPUOvercommit`	`warning`	Namespace でのオーバーコミットされた CPU リソース要求のクォータ。
`KubeMemOvercommit`	`warning`	Namespace でのオーバーコミットされたメモリーリソース要求のクォータ。
`alerKubeQuotaExceeded`	`warning`	namespace Namespace での Resource が X% 使用されている。
`KubePersistentVolumeUsageCritical`	`critical`	namespace Namespace の PersistentVolumeClaim で要求される永続ボリュームに X% の空きがある。
`KubePersistentVolumeFullInFourDays`	`critical`	直近のサンプリングにより、namespace Namespace の PersistentVolumeClaim で要求される永続ボリュームが 4 日以内で一杯になることが予想される。現時点で X バイトが利用可能。
`KubeNodeNotReady`	`warning`	Node が 1 時間を経過しても準備状態にならない。
`KubeVersionMismatch`	`warning`	Kubernetes コンポーネントの X 種類のバージョンが実行中である。
`KubeClientErrors`	`warning`	Kubernetes API サーバークライアントの 'Job/Instance' で X% エラーが発生している。
`KubeClientErrors`	`warning`	Kubernetes API サーバークライアントの 'Job/Instance' で毎秒 X エラーが発生している。
`KubeletTooManyPods`	`warning`	Kubelet Instance が上限の 110 に近い X Pod を実行している。
`KubeAPILatencyHigh`	`warning`	API サーバーに Verb Resource について 99 番目のパーセンタイルのレイテンシー X 秒がある。
`KubeAPILatencyHigh`	`critical`	API サーバーに Verb Resource について 99 番目のパーセンタイルのレイテンシー X 秒がある。
`KubeAPIErrorsHigh`	`critical`	API サーバーで X% の要求についてエラーが生じている。
`KubeAPIErrorsHigh`	`warning`	API サーバーで X% の要求についてエラーが生じている。
`KubeClientCertificateExpiration`	`warning`	Kubernetes API 証明書の有効期限が 7 日以内に切れる。
`KubeClientCertificateExpiration`	`critical`	Kubernetes API 証明書の有効期限が 1 日以内に切れる。
`AlertmanagerConfigInconsistent`	`critical`	要約: 設定の同期が取れていない。説明: Alertmanager クラスター `Service` のインスタンスの設定の同期が取れていない。
`AlertmanagerFailedReload`	`warning`	要約: Alertmanager の設定のリロードが失敗。説明: Alertmanager の設定のリロードが Namespace/Pod に対して失敗する。
`TargetDown`	`warning`	要約: ターゲットがダウンしている。説明: X% の Job ターゲットがダウンしている。
`DeadMansSwitch`	`none`	要約: DeadMansSwitch のアラート。説明: アラートパイプライン全体が機能することを確認するための DeadMansSwitch。
`NodeDiskRunningFull`	`warning`	node-exporter Namespace/Pod のデバイス Device が 24 時間以内に一杯の状態で実行される。
`NodeDiskRunningFull`	`critical`	node-exporter Namespace/Pod のデバイス Device が 2 時間以内に一杯の状態で実行される。
`PrometheusConfigReloadFailed`	`warning`	要約: Prometheus の設定のリロードに失敗。説明: Prometheus の設定が Namespace/Pod に対して失敗した。
`PrometheusNotificationQueueRunningFull`	`warning`	要約: Prometheus のアラート通知キューが一杯の状態で実行されている。説明: Prometheus のアラート通知キューが Namespace/Pod に対して一杯の状態で実行されている。
`PrometheusErrorSendingAlerts`	`warning`	要約: Prometheus からのアラートの送信時のエラー。説明: アラートの Prometheus Namespace/Pod から Alertmanager Alertmanager への送信時のエラー。
`PrometheusErrorSendingAlerts`	`critical`	要約: Prometheus からのアラートの送信時のエラー。説明: アラートの Prometheus Namespace/Pod から Alertmanager Alertmanager への送信時のエラー。
`PrometheusNotConnectedToAlertmanagers`	`warning`	要約: Prometheus が Alertmanager に接続されていない。説明: Prometheus Namespace/Pod が Alertmanager に接続されていない。
`PrometheusTSDBReloadsFailing`	`warning`	要約: Prometheus にディスクからのデータブロックのリロードの問題がある。説明: Instance の Job で、4 時間以内に X のリロードの問題が発生。
`PrometheusTSDBCompactionsFailing`	`warning`	要約: Prometheus でサンプルブロックのコンパクト化の問題がある。説明: Instance の Job で、4 時間以内に X のコンパクト化の問題が発生。
`PrometheusTSDBWALCorruptions`	`warning`	要約: Prometheus ログ先行書き込みが破損している。説明: Instance の Job に破損したログ先行書き込み (WAL) がある。
`PrometheusNotIngestingSamples`	`warning`	要約: Prometheus がサンプルを取り入れていない。説明: Prometheus Namespace/Pod がサンプルを取り入れていない。
`PrometheusTargetScrapesDuplicate`	`warning`	要約: Prometheus の多くのサンプルが拒否されている。説明: Namespace/Pod には、重複したタイムスタンプ (ただし異なる値を含む) により多くのサンプルが拒否されている。
`EtcdInsufficientMembers`	`critical`	Etcd クラスター "Job": メンバーが不十分 (X)。
`EtcdNoLeader`	`critical`	Etcd クラスター "Job": メンバー Instance にリーダーがない。
`EtcdHighNumberOfLeaderChanges`	`warning`	Etcd クラスター "Job": インスタンス Instance で 1 時間以内に X leader 変更が生じる。
`EtcdHighNumberOfFailedGRPCRequests`	`warning`	Etcd クラスター "Job": GRPC_Method についての X% の要求が etcd インスタンス Instance で失敗。
`EtcdHighNumberOfFailedGRPCRequests`	`critical`	Etcd クラスター "Job": GRPC_Method についての X% の要求が etcd インスタンス Instance で失敗。
`EtcdGRPCRequestsSlow`	`critical`	Etcd クラスター "Job": GRPC_Method の gRPC 要求に X_s on etcd instance _Instance がかかっている。
`EtcdMemberCommunicationSlow`	`warning`	Etcd クラスター "Job": To とのメンバー通信に X_s on etcd instance _Instance がかかっている。
`EtcdHighNumberOfFailedProposals`	`warning`	Etcd クラスター "Job": etcd インスタンス Instance での 1 時間以内の X proposal の失敗。
`EtcdHighFsyncDurations`	`warning`	Etcd クラスター "Job": 99 番目のパーセンタイルの fync 期間は X_s on etcd instance _Instance。
`EtcdHighCommitDurations`	`warning`	Etcd クラスター "Job": 99 番目のパーセンタイルのコミット期間 X_s on etcd instance _Instance.
`FdExhaustionClose`	`warning`	Job インスタンス Instance がそのファイル記述子をすぐに使い切る。
`FdExhaustionClose`	`critical`	Job インスタンス Instance がそのファイル記述子をすぐに使い切る。

5.3.4. アラートルール

詳細情報

試用、購入および販売

コミュニティー

会社概要

多様性を受け入れるオープンソースの強化

Red Hat ドキュメントについて

Theme

Red Hat legal and privacy links

Red Hat legal and privacy links