1.3.14. モニターリング
1.3.14.1. アラートルールの変更
OpenShift Container Platform 4.7 には、以下のアラートルールの変更が含まれます。
例1.1 アラートルールの変更
-
AlertmanagerClusterCrashlooping
アラートが追加されました。重大なアラートは、クラスター内の Alertmanager インスタンスの半分以上がクラッシュループしている場合に通知を出します。 -
AlertmanagerClusterDown
アラートが追加されました。重大なアラートは、クラスター内の Alertmanager インスタンスの半分以上が停止している場合に通知を出します。 -
AlertmanagerClusterFailedToSendAlerts
アラートが追加されました。重大なアラートは、クラスター内のすべての Alertmanager インスタンスが通知の送信に失敗した場合に通知を出します。 -
AlertmanagerFailedToSendAlerts
アラートが追加されました。警告のアラートは、Alertmanager インスタンスが通知の送信に失敗した場合に通知を出します。 -
etcdBackendQuotaLowSpace
アラートが追加されました。重大なアラートは、etcd クラスターのデータベースのサイズが etcd インスタンスで定義されるクォータを超える場合に通知を出します。 -
etcdExcessiveDatabaseGrowth
アラートが追加されました。警告アラートは、4 時間の間に etcd インスタンスのデータベースのサイズの 50% の増加を生じさせる etcd 書き込み増加が観察される場合に通知を出します。 -
etcdHighFsyncDurations
アラートが追加されました。重大なアラートは、etcd クラスターの 99 番目のパーセンタイルのfsync
期間が高すぎる場合に通知を出します。 -
KubeletClientCertificateRenewalErrors
アラートが追加されました。警告アラートは、Kubelet がそのクライアント証明書の更新に失敗した場合に通知を出します。 -
KubeletServerCertificateRenewalErrors
アラートが追加されました。警告アラートは、Kubelet がそのサーバー証明書の更新に失敗した場合に通知を出します。 -
NTODegraded
アラートが追加されました。警告アラートは、Node Tuning Operator のパフォーマンスが低下する場合に通知を出します。 -
NTOPodsNotReady
アラートが追加されました。警告アラートは、ノード上の特定の Pod が準備状態にない場合に通知を出します。 -
PrometheusOperatorNotReady
アラートが追加されました。警告アラートは、Prometheus Operator インスタンスが準備状態にない場合に通知を出します。 -
PrometheusOperatorRejectedResources
アラートが追加されました。警告アラートは、特定のリソースが Prometheus Operator によって拒否される場合に通知を出します。 -
PrometheusOperatorSyncFailed
アラートが追加されました。警告アラートは、Prometheus Operator のコントローラーが特定オブジェクトの調整に失敗した場合に通知を出します。 -
PrometheusTargetLimitHit
アラートが追加されました。警告アラートは、一部の収集設定がターゲットの制限を超えるために Prometheus がターゲットをドロップした場合に通知を出します。 -
ThanosSidecarPrometheusDown
アラートが追加されました。重大アラートは、Thanos サイドカーが Prometheus に接続できないことを示す通知を出します。 -
ThanosSidecarUnhealthy
アラートが追加されました。重大アラートは、Thanos サイドカーが指定された期間に正常ではないことを示す通知を出します。 -
NodeClockNotSynchronising
が更新され、chrony タイムサービスchronyd
を使用する環境での誤検知 (false positive) の発生を防ぐようになりました。 -
NodeNetworkReceiveErrs
アラートが更新され、レポートされるエラーの数が少ない場合にアラートが実行されなくなりました。ルールは、エラーの絶対数ではなく、パケットの合計に対するエラーの割合を使用します。 -
NodeNetworkTransmitErrs
アラートが更新され、レポートされるエラー数が少ない場合にアラートが実行されなくなりました。ルールは、エラーの絶対数ではなく、パケットの合計に対するエラーの割合を使用します。 -
重大度が warning および critical の
etcdHighNumberOfFailedHTTPRequests
アラートが削除されます。これらのアラートは、etcd インスタンスで高い割合の HTTP 要求が失敗する場合に実行されます。
注記
Red Hat は、メトリクス、記録ルールまたはアラートルールの後方互換性を保証しません。