D.5. Linux
本小节中介绍的探测可用于监控您 Linux 系统的基本状态。您可以在关键任务系统中使用它们,从而在系统出现致命错误前得到警告。
与其他的探测组不同(它们可能需要 Red Hat Network Monitoring Daemon 也可能不需要),这里的每一个 Linux 探测都需要在被监控的系统中运行
rhnmd
守护进程。
D.5.1. Linux::CPU Usage 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::CPU Usage 探测监控系统的 CPU 使用情况并收集以下数据:
- CPU 用量百分比 — 在探测执行时每 5 秒的 CPU 用量百分比。
要求 — 为了运行这个探测,必须在被监控的系统中运行 Red Hat Network Monitoring Daemon(
rhnmd
)。
项目 | 值 |
---|---|
超时* | 15 |
最大 CPU 用量百分比的 critical 阈值 | |
最大 CPU 使用百分比的 warning 阈值 |
D.5.2. Linux::Disk IO Throughput 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Disk IO Throughput 探测监控给定磁盘并收集以下数据:
- 读频率 — 每秒所读的数据量(以千字节为单位)。
- 写频率 — 每秒钟写数据的数量(以千字节为单位)。
要获得所需的「磁盘号或磁盘名」项的值,请在被监测的系统中运行
iostat
来查看您所需要的磁盘名或磁盘号。默认的值 0
通常会分配给直接连接到这个系统中的第一个硬盘。
要求 — 为了执行这个探测,必须在被监控的系统中运行 Red Hat Network Monitoring Daemon(
rhnmd
)。另外,「磁盘号或磁盘名」参数必须与在命令行下运行 iostat
命令的输出的格式相同。如果它们的格式不同,这个配置的探测会进入一个 UNKNOWN 状态。
项目 | 值 |
---|---|
磁盘号或磁盘名称* | 0 |
超时* | 15 |
最大的每秒读数据的数量(以 KB 为单位)的 critical 阈值 | |
最大的每秒读数据的数量(以 KB 为单位)的 warning 阈值 | |
最小的每秒读数据的数量(以 KB 为单位)的 warning 阈值 | |
最小的每秒读数据的数量(以 KB 为单位)的 critical 阈值 | |
最大的每秒写数据的数量(以 KB 为单位)的 critical 阈值 | |
最大的每秒写数据的数量(以 KB 为单位)的 warning 阈值 | |
最小的每秒写数据的数量(以 KB 为单位)的 warning 阈值 | |
最小的每秒写数据的数量(以 KB 为单位)的 critical 阈值 |
D.5.3. Linux::Disk Usage 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Disk Usage 探测监控具体文件系统的磁盘使用空间并收集以下数据:
- 使用的文件系统 — 当前被使用的文件系统的百分比。
- 使用的空间 — 当前被使用的文件系统的总量(以兆字节为单位)。
- 可用空间 — 当前可用的文件系统空间(以兆字节为单位)。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
文件系统* | /dev/hda1 |
超时* | 15 |
最大文件系统使用百分比的 critical 阈值 | |
最大文件系统使用百分比的 warning 阈值 | |
最大使用空间的 critical 阈值 | |
最大使用空间的 warning 阈值 | |
最小可用空间的 warning 阈值 | |
最小可用空间的 critical 阈值 |
D.5.4. Linux::Inodes 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Inodes 探测监控具体文件系统并收集以下数据:
- Inodes — 当前被使用的内节点百分比。
内节点是在 Linux 文件系统中保存信息的数据结构。每个文件都会有一个内节点,这个文件所在的文件系统通过文件的内节点区分每个文件。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
文件系统* | / |
超时* | 15 |
最大内节点使用百分比的 critical 阈值 | |
最大内节点使用百分比的 warning 阈值 |
D.5.5. Linux::Interface Traffic 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Interface Traffic 探测监控进入和离开某个具体接口(如 eth0)的数据流量并收集以下数据:
- 输入率 — 每秒钟进入某具体接口的字节数。
- 输出率 — 每秒钟某具体接口输出的字节数。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
接口* | |
超时* | 30 |
最大输入率的 critical 阈值 | |
最大输入率的 warning 阈值 | |
最小输入率的 warning 阈值 | |
最小输入率的 critical 阈值 | |
最大输出率的 critical 阈值 | |
最大输出率的 warning 阈值 | |
最小输出率的 warning 阈值 | |
最小输出率的 critical 阈值 |
D.5.6. Linux::Load 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Load 探测监控系统的 CPU 并收集以下数据:
- 负载 — 在一个阶段内系统 CPU 的平均负载。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
超时* | 15 |
一分钟平均 CPU 负载的 critical 阈值 | |
一分钟平均 CPU 负载的 warning 阈值 | |
五分钟平均 CPU 负载的 critical 阈值 | |
五分钟平均 CPU 负载的 warning 阈值 | |
十五分钟平均 CPU 负载的 critical 阈值 | |
十五分钟平均 CPU 负载的 warning 阈值 |
D.5.7. Linux::Memory Usage 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Memory Usage 探测监控系统中的内存的使用并收集以下数据:
- 空闲 RAM — 系统中的空闲的 RAM(以兆字节为单位)。
您可以在「包括可收回内存」项中输入
yes
或 no
将可收回的内存数据包括在收集的数据中。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
包括可收回内存 | 否 |
超时* | 15 |
最大空闲 RAM 的 warning 阈值 | |
最大空闲 RAM 的 critical 阈值 |
D.5.8. Linux::Process Counts by State 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Process 根据状态计数探测指定以下状态的进程数量:
- 阻塞的 — 已经被切换到等待队列,状态已经被转换为
等待
状态的进程。 - 不再使用的 — 已经被终止(被一个信号终止(kill)或调用了
exit()
)但父进程在执行wait()
系统调用时还没有收到这个进程被终止的通知的进程。 - 停止的 — 在它可以被执行完成前已被停止的进程。
- 休眠 — 处于
可中断
休眠状态的进程。它们可以在以后重新进入内存,并从它们离开的地方恢复执行。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
超时* | 15 |
最大阻塞进程数量的 critical 阈值 | |
最大阻塞进程数量的 warning 阈值 | |
最大非现存进程数量的 critical 阈值 | |
最大非现存进程数量的 warning 阈值 | |
最大终止进程的 critical 阈值 | |
最大终止进程的 warning 阈值 | |
最大睡眠进程的 critical 阈值 | |
最大睡眠进程的 warning 阈值 | |
最大子进程的 critical 阈值 | |
最大子进程的 warning 阈值 |
D.5.9. Linux::Process Count Total 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Process Count Total 探测监控系统并收集以下数据:
- 进程数 — 当前正在这个系统中运行的进程总数。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
超时* | 15 |
最大进程数的 critical 阈值 | |
最大进程数的 warning 阈值 |
D.5.10. Linux::Process Health 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Process Health 探测监控用户指定的进程并收集以下数据:
- CPU 用量 — 指定进程的 CPU 使用率(以每秒中使用的毫秒数计算)。这个数据会出现在
ps
输出的时间
栏中,它显示了这个进程使用 CPU 积累的时间。这使得这个数据独立于探测执行的间隔,允许设置合理的阈值并产生可用的数据统计图。 - 子进程组 — 具体进程的子进程数。子进程会从它的父进程中继承大量的属性(如打开的文件)。
- 线程 — 具体进程的运行线程的数量。线程是 CPU 的基本使用单元,它包括一个程序计数器、一个寄存器组和一个堆栈空间。线程又叫轻加权进程。
- 使用的物理内存 — 被指定进程使用的物理内存(或 RAM)的数(以千字节为单位)。
- 使用的虚拟内存 — 被指定进程使用的虚拟内存的数量(以千字节为单位);或是实际内存加上交换分区中的这个进程的大小。
通过使用命令名或进程 I.D.(PID)来指定进程。输入 PID 会覆盖输入的命令名。如果没有输入命令名或 PID,则会显示
Command not found
出错信息,同时将探测设定为 CRITICAL 状态。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
命令名 | |
进程 ID(PID)文件 | |
超时* | 15 |
最大 CPU 使用的 critical 阈值 | |
最大 CPU 使用的 warning 阈值 | |
最大子进程组的 critical 阈值 | |
最大子进程组的 warning 阈值 | |
最大线程的 critical 阈值 | |
最大线程的 warning 阈值 | |
最大使用的物理内存的 critical 阈值 | |
最大使用的物理内存的 warning 阈值 | |
最大使用的虚拟内存的 critical 阈值 | |
最大使用的虚拟内存的 warning 阈值 |
D.5.11. Linux::Process Running 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Process Running 探测被用来验证指定的进程是否正正常运行。它会根据「进程组数」选择框的选择情况来记录进程的数量或进程组的数量。
在默认的情况下选择此选项,即这个探测应该统计独立于子进程数量的进程组领导进程的数。例如,它允许您比较两个运行的 Apache Web server 项而不用考虑它们的子进程的(动态)数量。如果它没有被选择,这个探测就会统计与指定的进程匹配的进程数量(包括子进程和领导进程)。
通过命令名或进程 ID(PID)指定进程。输入 PID 会覆盖输入的命令名。如果没有输入命令名或 PID,则会显示
Command not found
出错信息,且探测会成为 CRITICAL 状态。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
命令名 | |
PID 文件 | |
进程组数 | (选定) |
超时* | 15 |
最大运行数量的 critical 阈值 | |
最小运行数量的 critical 阈值 |
D.5.12. Linux::Swap Usage 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Swap Usage 探测监控系统的 swap 分区的使用情况并收集以下数据:
- 空闲的 swap 分区 — 当前空闲的 swap 分区的百分比。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
超时* | 15 |
最小空闲交换分区的 warning 阈值 | |
最小空闲交换分区的 critical 阈值 |
D.5.13. Linux::TCP Connections by State 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::TCP Connections by State 探测指定所有的 TCP 连接数和每个 TCP 连接中的处于以下状态的连接数:
- TIME_WAIT — 在关闭了远程停机传输后 socket 等待的时间。在这段时间内,它还可以处理已经存在在网络中的数据包。
- CLOSE_WAIT — 远程部分已经终止,等待关闭 socket。
- FIN_WAIT — socket 已关闭,正在关闭该连接。
- ESTABLISHED — 已经建立了到 socket 的连接。
- SYN_RCVD — 已经从网络上收到了连接请求。
这个探测可以帮助查找并隔离指定 IP 地址的网络流量;或检查到被监控系统的网络连接。
这个探测的过滤参数可以帮助您减小探测的范围。这个探测使用
netstat -ant
命令收集数据。「本地 IP 地址」和「本地端口」参数使用输出中的「本地地址」栏中的数据;「远程 IP 地址」和「远程端口」参数使用输出中的「外部地址」栏中的信息。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
本地的 IP 地址过滤器特征列表 | |
本地端口过滤器 | |
远程的 IP 地址过滤器特征列表 | |
远程端口过滤器 | |
超时* | 15 |
最大连接数量的 critical 阈值 | |
最大连接数量的 warning 阈值 | |
最大 TIME_WAIT 连接的 critical 阈值 | |
最大 TIME_WAIT 连接的 warning 阈值 | |
最大 CLOSE_WAIT 连接的 critical 阈值 | |
最大 CLOSE_WAIT 连接的 warning 阈值 | |
最大 FIN_WAIT 连接的 critical 阈值 | |
最大 FIN_WAIT 连接的 warning 阈值 | |
最大 ESTABLISHED 连接的 critical 阈值 | |
最大 ESTABLISHED 连接的 warning 阈值 | |
最大 SYN_RCVD 连接的 critical 阈值 | |
最大 SYN_RCVD 连接的 warning 阈值 |
D.5.14. Linux::Users 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Users 探测监控系统中的用户并收集以下数据:
- 用户 — 当前登录的用户数量。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
超时* | 15 |
最大用户数的 critical 阈值 | |
最大用户数的 warning 阈值 |
D.5.15. Linux::Virtual Memory 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
Linux::Virtual Memory 探测监控系统内存总量并收集以下数据:
- 虚拟内存 — 空闲的总内存(包括 RAM 和交换分区)的百分比。
要求 — 要执行这个探测,您必须在被监控的系统中运行 Red Hat Network Monitoring Daemon (
rhnmd
) 。
项目 | 值 |
---|---|
超时* | 15 |
最小空闲虚拟内存的 warning 阈值 | |
最小空闲虚拟内存的 critical 阈值 |