D.10. RHN Satellite
本小节中介绍的探测适用于 RHN Satellite 本身监控其运行状况和性能。因为这些探测都是在本地运行的,所以不需要特定的应用程序或通信协议。
D.10.1. RHN Satellite::Disk Space 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
RHN Satellite::Disk Space 探测监控 Satellite 服务器中的剩余磁盘空间并收集以下数据:
- 使用的文件系统 — 目前被使用的文件系统的百分比。
- 使用的空间 — 当前的文件系统使用的文件大小。
- 可用空间 — 当前的文件系统可用的文件大小。
项目 | 值 |
---|---|
设备路径名* | /dev/hda1 |
最大使用的文件系统的 critical 阈值 | |
最大使用的文件系统的 warning 阈值 | |
最大使用空间的 critical 阈值 | |
最大使用空间的 warning 阈值 | |
最大可用空间的 critical 阈值 | |
最大可用空间的 warning 阈值 |
D.10.2. RHN Satellite::Execution Time 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
RHN Satellite::Execution Time 探测监控 Satellite 中运行的探测的运行时间并收集以下数据:
- 探测平均执行时间 — 完全执行一个探测所需的时间(以秒为单位)。
项目 | 值 |
---|---|
最大探测平均执行时间的 critical 阈值 | |
最大探测平均执行时间的 warning 阈值 |
D.10.3. RHN Satellite::Interface Traffic 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
RHN Satellite::Interface Traffic 探测监控 Satellite 中网络接口的流量并收集以下数据:
- 输入率 — 这个设备每秒接收的字节数。
- 输出率 — 这个设备每秒发送的字节数。
项目 | 值 |
---|---|
接口* | eth0 |
超时(seconds)* | 30 |
最大输入率的 critical 阈值 | |
最大输出率的 critical 阈值 |
D.10.4. RHN Satellite::Latency 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
RHN Satellite::Latency 探测监控 Satellite 中探测的延迟并收集以下数据:
- 探测平均延迟 — 从探测可以运行到探测实际运行所需的时间。在通常情况下,这个时间会小于一秒。当 Satellite 有非常大的负载时,这个时间会延长。
项目 | 值 |
---|---|
最大平均探测延迟的 critical 阈值 | |
最大平均探测延迟的 warning 阈值 |
D.10.5. RHN Satellite::Load 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
RHN Satellite::Load 探测监控 Satellite 服务器中 CPU 负载并收集以下数据:
- 负载 — 在 1 分钟、5 分钟和 15 分钟内的 CPU 平均负载。
项目 | 值 |
---|---|
最大 1 分钟平均负载的 critical 阈值 | |
最大 1 分钟平均负载的 warning 阈值 | |
最大 5 分钟平均负载的 critical 阈值 | |
最大 5 分钟平均负载的 warning 阈值 | |
最大 15 分钟平均负载的 critical 阈值 | |
最大 15 分钟平均负载的 warning 阈值 |
D.10.6. RHN Satellite::Probe Count 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
RHN Satellite::Probe Count 探测监控 Satellite 服务器中探测的数量并收集以下数据:
- 探测 — 在 Satellite 服务器中运行的独立探测数量。
项目 | 值 |
---|---|
最大探测数量的 critical 阈值 | |
最大探测数量的 warning 阈值 |
D.10.7. RHN Satellite::Process Counts 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
RHN Satellite::Process Counts 探测监控 Satellite 服务器中进程的数量并收集以下数据:
- 阻塞的进程 — 已经被转换到等待队列和等待状态的进程数量。
- 子进程 — 由已经在这台机器中运行的另一个进程生成的进程数。
- 不再使用的 — 已经被终止(可能被一个信号终止或调用了
exit()
)但它的父进程在执行wait()
系统调用而还没有接收到它们已被终止的进程的数量。 - 停止的 — 在它们的执行过程还没有完成前就已经被停止的进程的数量。
- 休眠 — 处于
可中断
休眠状态的进程。它们可以在以后重新进入内存,并从它们离开的地方恢复执行。
项目 | 值 |
---|---|
最大阻塞进程数量的 critical 阈值 | |
最大阻塞进程数量的 warning 阈值 | |
最大子进程的 critical 阈值 | |
最大子进程的 warning 阈值 | |
最大非现存进程数量的 critical 阈值 | |
最大非现存进程数量的 warning 阈值 | |
最大终止进程的 critical 阈值 | |
最大终止进程的 warning 阈值 | |
最大睡眠进程的 critical 阈值 | |
最大睡眠进程的 warning 阈值 |
D.10.8. RHN Satellite::Processes 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
RHN Satellite::Processes 探测监控 Satellite 中进程的数量并收集以下数据:
- 进程 — 在这台机器中同时运行的进程数。
项目 | 值 |
---|---|
最大进程数量的 critical 阈值 | |
最大进程数量的 warning 阈值 |
D.10.9. RHN Satellite::Process Health 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
RHN Satellite::Process Health 探测监控用户指定的进程并收集以下数据:
- CPU 用量 — 指定进程的 CPU 用量。
- 子进程组 — 具体进程的子进程数。子进程会从它的父进程中继承大量的属性(如打开的文件)。
- 线程 — 具体进程的运行线程的数量。线程是 CPU 的基本使用单元,它包括一个程序计数器、一个寄存器组和一个堆栈空间。线程又叫轻加权进程。
- 使用的物理内存 — 被指定进程使用的物理内存数(以千字节为单位)。
- 使用的虚拟内存 — 被指定进程使用的虚拟内存的数(以千字节为单位);或是在实际内存加上 swap 的大小。
通过使用命令名或进程 I.D.(PID)来指定进程。输入 PID 会覆盖输入的命令名。如果没有输入命令名或 PID,则会显示
Command not found
出错信息,探测会成为 CRITICAL 状态。
项目 | 值 |
---|---|
命令名 | |
进程 ID(PID)文件 | |
超时* | 15 |
最大 CPU 使用的 critical 阈值 | |
最大 CPU 使用的 warning 阈值 | |
最大子进程组的 critical 阈值 | |
最大子进程组的 warning 阈值 | |
最大线程的 critical 阈值 | |
最大线程的 warning 阈值 | |
最大使用的物理内存的 critical 阈值 | |
最大使用的物理内存的 warning 阈值 | |
最大使用的虚拟内存的 critical 阈值 | |
最大使用的虚拟内存的 warning 阈值 |
D.10.10. RHN Satellite::Process Running 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
RHN Satellite::Process Running 探测验证指定的进程正在运行。这个进程通过命令名或进程 I.D.(PID)指定。输入一个 PID 会覆盖输入的命令名。如果这个探测无法验证这个命令或 PID,将会得到一个 Critical 状态。
项目 | 值 |
---|---|
命令名 | |
进程 ID(PID)文件 | |
最大进程运行数量的 critical 阈值 | |
最小进程运行数量的 critical 阈值 |
D.10.11. RHN Satellite::Swap 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
RHN Satellite::Swap 探测监控 Satellite 服务器中可用交换空间百分比。如果这个值低于 critical 阈值,会得到一个 CRITICAL 状态;如果这个值低于 warning 阈值,会得到一个 WARNING 状态。
项目 | 值 |
---|---|
最小空闲交换分区百分比的 critical 阈值 | |
最小空闲交换分区百分比的 warning 阈值 |
D.10.12. RHN Satellite::Users 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
RHN Satellite::Users 探测监控当前登录到 Satellite 服务器的用户数量。如果这个数量超过了 critical 阈值,会得到一个 CRITICAL 状态;如果这个数量超过了 warning 阈值,会得到一个 WARNING 的状态。
项目 | 值 |
---|---|
最大用户数的 critical 阈值 | |
最大用户数的 warning 阈值 |