7.5. 灾难恢复警报


本节提供了在灾难恢复环境中与 Red Hat OpenShift Data Foundation 关联的所有支持警报的列表。

记录规则

  • record: ramen_sync_duration_seconds

    表达式
    sum by (obj_name, obj_namespace, obj_type, job, policyname)(time() - (ramen_last_sync_timestamp_seconds > 0))
    Copy to Clipboard Toggle word wrap
    用途
    卷组最后一次同步时间和时间(以秒为单位)之间的时间间隔。
  • Record: ramen_rpo_difference

    表达式
    ramen_sync_duration_seconds{job="ramen-hub-operator-metrics-service"} / on(policyname, job) group_left() (ramen_policy_schedule_interval_seconds{job="ramen-hub-operator-metrics-service"})
    Copy to Clipboard Toggle word wrap
    用途
    预期同步延迟和卷复制组所使用的实际同步延迟之间的差别。
  • Record: count_persistentvolumeclaim_total

    表达式
    count(kube_persistentvolumeclaim_info)
    Copy to Clipboard Toggle word wrap
    用途
    来自受管集群的所有 PVC 的总和。

警报

  • alert: VolumeSynchronizationDelay

    影响
    Critical
    用途
    卷复制组占用的实际同步延迟是延迟预期同步延迟。
    YAML
    alert: VolumeSynchronizationDelay
    expr: ramen_rpo_difference >= 3
    for: 5s
    labels:
      severity: critical
    annotations:
      description: "The syncing of volumes is exceeding three times the scheduled snapshot interval, or the volumes have been recently protected. (DRPC: {{ $labels.obj_name }}, Namespace: {{ $labels.obj_namespace }})"
      alert_type: "DisasterRecovery"
    Copy to Clipboard Toggle word wrap
  • alert: VolumeSynchronizationDelay

    影响
    Warning
    用途
    卷复制组占用的实际同步延迟是预期的同步延迟的两倍。
    YAML
    alert: VolumeSynchronizationDelay
    expr: ramen_rpo_difference > 2 and ramen_rpo_difference < 3
    for: 5s
    labels:
      severity: warning
    annotations:
      description: "The syncing of volumes is exceeding two times the scheduled snapshot interval, or the volumes have been recently protected. (DRPC: {{ $labels.obj_name }}, Namespace: {{ $labels.obj_namespace }})"
      alert_type: "DisasterRecovery"
    Copy to Clipboard Toggle word wrap
  • 警报: WorkloadUnprotected

    影响
    Warning
    用途
    应用程序保护状态降级超过 10 分钟
    YAML
    alert: WorkloadUnprotected
    expr: ramen_workload_protection_status == 0
    for: 10m
    labels:
      severity: warning
    annotations:
      description: "Workload is not protected for disaster recovery (DRPC: {{ $labels.obj_name }}, Namespace: {{ $labels.obj_namespace }})."
      alert_type: "DisasterRecovery"
    Copy to Clipboard Toggle word wrap
返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat