6.6. 监控设备资源


您可以为设备资源设置监控器,并在使用这些资源超过定义的阈值时定义警报。当代理警告 Red Hat Edge Manager 服务时,该服务会将设备状态设置为 "degraded" 或 "error" (取决于严重性级别)。

资源监控器使用以下参数:

Expand
参数描述

MonitorType

要监控的资源。目前支持的资源包括 "CPU"、"Memory" 和 "Disk"。

SamplingInterval

monitor 样本使用的时间间隔,指定为正整数,后跟一个时间单位("s" (秒)、"m"表示分钟,"h"表示小时)。

AlertRules

警报规则列表。

路径

(仅限磁盘监控)要监控的目录的绝对路径。使用率反映了包含路径的文件系统,类似于 df,即使它不是挂载点。

警报规则采用以下参数:

Expand
参数描述

重要性

警报规则的严重性级别为 "Info", "Warning", 或 "Critical"。每个严重性级别只允许一个警报规则。

Duration

资源使用的持续时间在抽样时测量和平均值,超过正整数,后跟一个时间单位("s" (以秒为单位),"m"表示分钟,"h"表示小时)。它必须小于抽样间隔。

百分比

触发警报的使用阈值,以百分比值(基于 0 到 100,没有 "%" 符号)。

描述

警报的人类可读描述。这可用于添加有助于调试的警报的详细信息。默认情况下,它会填充警报,超过 : load 为高于 >%。

6.6.1. 监控 CLI 上的设备资源

通过 CLI 监控设备的资源,为您提供跟踪性能并排除问题的工具和命令。

流程

  • 在设备规格的 resources: 部分添加资源监控器。

    例如,为您的磁盘添加以下监控器:

    apiVersion: flightctl.io/v1alpha1
    kind: Device
    metadata:
      name: <device_name>
    spec:
    [...]
      resources:
      - monitorType: Disk
        samplingInterval: 5s 
    1
    
        path: /application_data 
    2
    
        alertRules:
        - severity: Warning 
    3
    
          duration: 30m
          percentage: 75
          description: Disk space for application data is >75% full for over 30m.
        - severity: Critical 
    4
    
          duration: 10m
          percentage: 90
          description: Disk space for application data is >90% full over 10m.
    [...]
    1
    每 5 秒进行样本使用。
    2
    检查与 /applications_data 路径关联的文件系统上的磁盘用量。
    3
    如果平均用量超过 30 分钟,则启动警告。
    4
    如果平均使用量超过 90% 超过 10 分钟,则启动一个关键警报。
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2026 Red Hat
返回顶部