8.5. 灾难恢复指标
这些是 prometheus scrapped 的框架指标。
- ramen_last_sync_timestamp_seconds
- ramen_policy_schedule_interval_seconds
- ramen_last_sync_duration_seconds
- ramen_last_sync_data_bytes
- ramen_workload_protection_status
从安装了 Red Hat Advanced Cluster Management for Kubernetes (RHACM operator)的 Hub 集群运行这些指标。
8.5.1. 最后同步时间戳(以秒为单位) 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
这是以秒为单位,可让每个应用程序最近成功同步所有 PVC 的时间(以秒为单位)。
- 指标名称
-
ramen_last_sync_timestamp_seconds - 指标类型
- 量表
- 标签
-
objtype: 对象的类型,此处的 DRPC -
ObjName: 对象的名称,这里是 DRPC-Name -
ObjNamespace: DRPC 命名空间 -
policyName: DRPolicy 的名称 -
schedulingInterval:来自 DRPolicy 的调度间隔值
-
- 指标值
-
该值被设置为 Unix 秒,从 DRPC 状态获取
lastGroupSyncTime。
8.5.2. 策略调度间隔(以秒为单位) 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
这提供了 DRPolicy 的调度间隔(以秒为单位)。
- 指标名称
-
ramen_policy_schedule_interval_seconds - 指标类型
- 量表
- 标签
-
policyName: DRPolicy 的名称
-
- 指标值
- 这设置为从 DRPolicy 进行的调度间隔(以秒为单位)。
8.5.3. 最后同步持续时间(以秒为单位) 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
这代表了从每个应用程序所有 PVC 的最新成功同步的最长时间。
- 指标名称
-
ramen_last_sync_duration_seconds - 指标类型
- 量表
- 标签
-
obj_type: 对象的 Type,此处为 DRPC -
obj_name: 对象的名称,这里是 DRPC-Name -
obj_namespace: DRPC 命名空间 -
scheduling_interval:来自 DRPolicy 的调度间隔值
-
- 指标值
-
该值取自 DRPC 状态的
lastGroupSyncDuration。
8.5.4. 从最新同步传输的总字节数 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
这个值代表从每个应用程序的所有 PVC 的最新成功同步传输的总字节数。
- 指标名称
-
ramen_last_sync_data_bytes - 指标类型
- 量表
- 标签
-
obj_type: 对象的 Type,此处为 DRPC -
obj_name: 对象的名称,这里是 DRPC-Name -
obj_namespace: DRPC 命名空间 -
scheduling_interval:来自 DRPolicy 的调度间隔值
-
- 指标值
-
该值取自 DRPC 状态中的
lastGroupSyncBytes。
8.5.5. 工作负载保护状态 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
这个值为每个受 DR 保护的应用程序提供应用程序保护状态。
- 指标名称
-
ramen_workload_protection_status - 指标类型
- 量表
- 标签
-
objtype: 对象的类型,此处的 DRPC -
ObjName: 对象的名称,这里是 DRPC-Name -
ObjNamespace: DRPC 命名空间
-
- 指标值
- 该值可以是 "1" 或 "0",其中 "1" 表示应用程序 DR 保护处于健康状态,"0"表示应用程序保护丢失,并可能取消保护。