附录 D. 探测
如 第 4.10 节 “监控” 所示,有 Monitoring 授权的系统可以使用探测确定运行状态。这个附录按命令组分类(如 Apache)列出了可用的探测。
许多探测监控您系统内部的状态,而不是处理外部的元素(如 Network Services::SSH 探测)的探测需要安装 Red Hat Network Monitoring Daemon(
rhnmd
)。这个要求会在独立探测参考中提出。
每个探测都有它自己的参考信息,这些参考信息指定了必需的项(以 * 标记)、默认值和触发警告的阈值。同样的,在每个命令组小节的开始会有适用于这个组所有命令的信息。第 D.1 节 “探测指南” 一节中包含所有探测的通用信息,其他的小节介绍了每个独立的探测。
注意
几乎所有的探测都使用传输控制协议(Transmission Control Protocol,TCP)作为其传输协议。会在独立探测参考中列出例外事项。
D.1. 探测指南 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
以下常规指南概括了每个探测状态的含义并为您提供了设定阈值的方法。
以下列表为每个探测状态提供了一个简明的描述:
- 未知(Unkonwn)
- 无法接收用来决定探测状态的统计数据的探测。大多数(不是全部)探测会在超时发生时进入这个状态。处于这个状态的探测也可能是由于错误的配置造成的。
- 等待处理(Pending)
- RHN Satellite 还没有接收到数据的探测。这个状态对新探测非常常见。但是,如果所有的探测都进入了这个状态,您的监测系统就可能出现了问题。
- 确定(OK)
- 已经成功运行并没有出现任何错误的探测。所有的探测都应该是这个状态。
- 警告
- 这个探测超过了它们的 WARNING 阈值。
- 严重(Critical)
- 超过 CRITICAL 阈值或因为其他原因(如一些探测会在超时后进入 critical 状态)进入 critical 状态的探测。
添加探测的时候,选择适当的探测值。当超过这些探测值的时候,您和您的系统管理员可以收到您的系统有问题的通知。除非特别注明,超时的时间是以秒为单位的。与以上规则不同的情况会在相应的探测参考中单独注明。
重要
一些探测有基于时间的阈值。为了使基于时间的 CRITICAL 和 WARNING 阈值可以正确工作,它们的值不能超过超时的时间。否则的话,在达到 CRITICAL 和 WARNING 前,一个 UNKNOWN 的状态会被报告,从而设空阈值。因此,Red Hat 强烈建议您将超时的值设置为大于所有计时的阈值。
请记住,Red Hat 建议您在为您的每个系统建立性能基线的时候,在不发送通知的情况下运行您的探测。虽然为探测提供的默认值可能会适用于您的需求,您可能还是需要根据您的具体的工作环境更改一些探测的阈值。