6.5. 障害復旧アラート


このセクションでは、ディザスターリカバリー環境内の Red Hat OpenShift Data Foundation に関連してサポートされているすべてのアラートのリストを提供します。

記録ルール

  • レコード: ramen_sync_duration_seconds

    sum by (obj_name, obj_namespace, obj_type, job, policyname)(time() - (ramen_last_sync_timestamp_seconds > 0))
    目的
    ボリュームグループの最後の同期時刻と現在の時刻の間の時間間隔 (秒単位)。
  • レコード: ramen_rpo_difference

    ramen_sync_duration_seconds{job="ramen-hub-operator-metrics-service"} / on(policyname, job) group_left() (ramen_policy_schedule_interval_seconds{job="ramen-hub-operator-metrics-service"})
    目的
    予想される同期遅延と、ボリュームレプリケーショングループによって発生する実際の同期遅延との差。
  • レコード: count_persistentvolumeclaim_total

    count(kube_persistentvolumeclaim_info)
    目的
    マネージドクラスターからのすべての PVC の合計。

アラート

  • アラート: VolumeSynchronizationDelay

    影響
    Critical
    目的
    ボリュームレプリケーショングループによる実際の同期遅延は、予想される同期遅延の 3 倍になります。
    YAML
    alert: VolumeSynchronizationDelay
    expr: ramen_rpo_difference >= 3
    for: 5s
    labels:
      severity: critical
    annotations:
      description: "The syncing of volumes is exceeding three times the scheduled snapshot interval, or the volumes have been recently protected. (DRPC: {{ $labels.obj_name }}, Namespace: {{ $labels.obj_namespace }})"
      alert_type: "DisasterRecovery"
  • アラート: VolumeSynchronizationDelay

    影響
    Warning
    目的
    ボリュームレプリケーショングループによる実際の同期遅延は、予想される同期遅延の 2 倍になります。
    YAML
    alert: VolumeSynchronizationDelay
    expr: ramen_rpo_difference > 2 and ramen_rpo_difference < 3
    for: 5s
    labels:
      severity: warning
    annotations:
      description: "The syncing of volumes is exceeding two times the scheduled snapshot interval, or the volumes have been recently protected. (DRPC: {{ $labels.obj_name }}, Namespace: {{ $labels.obj_namespace }})"
      alert_type: "DisasterRecovery"
  • アラート: WorkloadUnprotected

    影響
    Warning
    目的
    アプリケーション保護ステータスが 10 分以上デグレード状態にあります。
    YAML
    alert: WorkloadUnprotected
    expr: ramen_workload_protection_status == 0
    for: 10m
    labels:
      severity: warning
    annotations:
      description: "Workload is not protected for disaster recovery (DRPC: {{ $labels.obj_name }}, Namespace: {{ $labels.obj_namespace }})."
      alert_type: "DisasterRecovery"
Red Hat logoGithubRedditYoutubeTwitter

詳細情報

試用、購入および販売

コミュニティー

Red Hat ドキュメントについて

Red Hat をお使いのお客様が、信頼できるコンテンツが含まれている製品やサービスを活用することで、イノベーションを行い、目標を達成できるようにします。

多様性を受け入れるオープンソースの強化

Red Hat では、コード、ドキュメント、Web プロパティーにおける配慮に欠ける用語の置き換えに取り組んでいます。このような変更は、段階的に実施される予定です。詳細情報: Red Hat ブログ.

会社概要

Red Hat は、企業がコアとなるデータセンターからネットワークエッジに至るまで、各種プラットフォームや環境全体で作業を簡素化できるように、強化されたソリューションを提供しています。

© 2024 Red Hat, Inc.