6.6. 监控设备资源
您可以为设备资源设置监控器,并在使用这些资源超过定义的阈值时定义警报。当代理警告 Red Hat Edge Manager 服务时,该服务会将设备状态设置为 "degraded" 或 "error" (取决于严重性级别)。
资源监控器使用以下参数:
| 参数 | 描述 |
|---|---|
| MonitorType | 要监控的资源。目前支持的资源包括 "CPU"、"Memory" 和 "Disk"。 |
| SamplingInterval | monitor 样本使用的时间间隔,指定为正整数,后跟一个时间单位("s" (秒)、"m"表示分钟,"h"表示小时)。 |
| AlertRules | 警报规则列表。 |
| 路径 | (仅限磁盘监控)要监控的目录的绝对路径。使用率反映了包含路径的文件系统,类似于 df,即使它不是挂载点。 |
警报规则采用以下参数:
| 参数 | 描述 |
|---|---|
| 重要性 | 警报规则的严重性级别为 "Info", "Warning", 或 "Critical"。每个严重性级别只允许一个警报规则。 |
| Duration | 资源使用的持续时间在抽样时测量和平均值,超过正整数,后跟一个时间单位("s" (以秒为单位),"m"表示分钟,"h"表示小时)。它必须小于抽样间隔。 |
| 百分比 | 触发警报的使用阈值,以百分比值(基于 0 到 100,没有 "%" 符号)。 |
| 描述 | 警报的人类可读描述。这可用于添加有助于调试的警报的详细信息。默认情况下,它会填充警报,超过 : load 为高于 >%。 |
6.6.1. 监控 CLI 上的设备资源 复制链接链接已复制到粘贴板!
通过 CLI 监控设备的资源,为您提供跟踪性能并排除问题的工具和命令。
流程
在设备规格的
resources:部分添加资源监控器。例如,为您的磁盘添加以下监控器:
apiVersion: flightctl.io/v1alpha1 kind: Device metadata: name: <device_name> spec: [...] resources: - monitorType: Disk samplingInterval: 5s1 path: /application_data2 alertRules: - severity: Warning3 duration: 30m percentage: 75 description: Disk space for application data is >75% full for over 30m. - severity: Critical4 duration: 10m percentage: 90 description: Disk space for application data is >90% full over 10m. [...]