4.10. 监控


当您点顶部导航栏中的「监控」标签页时会出现「监控」类别和链接。这些需要 监控 授权的页允许您查看您所设置的侦测对有 监控 授权系统探测的结果,并管理您监控设施配置。
使用「系统详情」页中的「探测」标签页启动您的系统监控。有关该标签的论述请参考 第 4.4.2.10 节 “系统详情”。有关可用探测的完整列表请参阅 附录 D, 探测

4.10.1. 探测状态

(查看此标签需要监控授权。)在您点击顶部导航栏中的「监控」标签时会默认显示「探测状态」页。
「探测状态」页显示了处于不同状态的探测的数量并为快速查找有问题的探测提供了一个简单的界面。请注意在这个页顶部的标签页中的探测总数可能与这个表格中的数目不同。在上面的数据包括了您机构内所有系统的探测,而表格中的数据只显示了您通过系统组管理员角色访问的系统中的探测。另外,这里的探测可能在过去的一分钟内没有被同步。
以下列表描述了每个状态并显示了与它们相连的图标:
  • 严重(Critical) - 探测已经超过 CRITICAL 界限。
  • 警告(Warning) - 探测已经超过 WARNING 界限。
  • 未知(Unknown) - 探测无法准确报告度量或者状态数据。
  • 等待处理(Pending) - 已经计划探测但还没有运行或者无法运行。
  • 确定(OK) - 探测成功运行。
「探测状态」页包括每个可能状态的标签页并有一个包括了所有探测的标签页。每个页都包括了指示探测状态、被监控的系统、使用的探测以及最后更新这个状态的日期和时间的栏目。
在这些表格中,点系统名会进入「系统详情」页中的「监控」标签页。点探测名可以进入它的「当前状态」页。在那里您可以编辑、删除该探测,或者根据其结果生成报告。
以前只有通过 web 界面才能获得的监控数据和探测状态信息,现在可以最为 CSV 文件导入。点击 监控 页中的「下载 CSV」链接下载相关信息的 CSV 文件。导出的数据可能会包括(当不仅限于)以下信息:
  • 探测状态
  • 所有给出状态(OK, WARN, UNKNOWN, CRITICAL, PENDING)的探测
  • 探测事件历史记录

4.10.1.1. 探测状态 ⇒ Critical

(要查看这个标签需要有监控授权。)超过了其 CRITICAL 阈值或因为其他原因达到了严重状态的探测。例如,一些探测在超过了超时期后会到达严重状态(而不是未知状态)。

4.10.1.2. 探测状态 ⇒ 警告

这个探测超过了它们的 WARNING 阈值。

4.10.1.3. 探测状态 ⇒ 未知

(查看此功能需要监控授权。)无法获得用来决定探测状态的数据的探测。大多数,并不是全部探测会在超过了它们的超时期后进入未知状态。这意味着您所设置的超时期可能太短了,需要增加;或到被监控系统的连接无法建立。
这也可能是由于探测的配置参数不正确,且无法找到其数据。最后,这个状态还可能表示发生了软件错误。

4.10.1.4. 探测状态 ⇒ 等待处理

RHN 还没有收到数据的探测。在探测已被调度,但还没有运行时会产生这个状态。如果所有的探测都是等待处理的状态,您的监控设施可能出现了问题。

4.10.1.5. 探测状态 ⇒ 确定

(查看此功能需要监控授权。)该探测无一例外会成功运行。这是所有探测都想要的状态。

4.10.1.6. 探测状态 ⇒ 所有

(查看此功能需要监控授权。)所有您帐户中在系统中调度的探测,根据系统名称的字母顺序列出。

4.10.1.7. 当前状态

表示所选择探测的状态以及它最后一次运行的时间,并提供产生这个探测报告的功能。虽然这个页包括在监控中,它还可以在「系统详情」页中的 「探测」标签页中找到。这是因为它的配置是针对被监控的系统的。
要查看探测结果报告,请使用「日期」项来选择相关的时间并决定您是否需要查看统计数据、状态更改历史记录或全部。要获得统计数据,选择您需要的数据并决定(使用选择框)以什么形式(图形、错误日志或全部)显示结果。然后点这个页底部的 生成报告 按钮。如果这个探测的统计中没有数据,您会得到一个 NO DATA SELECTED TIME PERIOD AND METRIC (在指定的时间段中没有找到数据)的信息。

4.10.2. 通知

(查看此标签需要监控授权。)指定为您的机构内建立的联系的方法。这些方法包括探测所发出的警告被发送的电子邮件或寻呼机地址。
在默认的「通知」屏幕中列出了您的机构可以选择使用的、不同的通知方法。这些通知方法会根据适用它们的用户来列出。
要创建新的通知方法,请点击要使用这个通知的用户名。此时会出现该客户端用户详情 ⇒ 通知方法页面。详情请参阅 第 4.9.1.1.7 节 “用户列表 ⇒ 活跃 ⇒ 用户详情 ⇒ 通知方法”。点击通知方法的名称可以编辑这个方法的属性。

4.10.2.1. 通知 ⇒ 过滤器

通知过滤器可让您创建长期的规则来暂停、重定向、自动告知收到通知和发送补充通知。它对管理非常活跃或需要输出详细信息的探测非常有用。
这是通知过滤标签页的默认屏幕。它列出了对您的机构有效的所有活跃的过滤。点过滤的名称可以编辑这个过滤的属性。
要创建通知过滤器,请点这个屏幕右上角的「创建新通知过滤器」链接。配置它所列出的每个选项,然后点 保存过滤 创建这个过滤器。
  1. 描述:为这个过滤输入值来和其他的过滤区分。
  2. 类型:决定这个过滤将执行什么行动:重定向、确认收到、暂时停止或补充收到的通知。
  3. 发送到:第二步中的选项「重定向通知」和「补充通知」 需要一个发送的电子邮件地址。其他的选项不需要电子邮件地址。
  4. 范围:决定将该过滤器用于哪个监控组件。
  5. 机构/侦察/探测:这个选项允许您选择这个过滤对哪些机构、侦察或探测适用。要从这个列表中选择多个项,在点项的名称的时候按住 Ctrl 键。要选择连续的一组项时,按住 Shift 键后点第一个项和最后一个项。
  6. 属于这个状态的探测:选择这个过滤适用于哪些探测状态。例如,您可以选择只为严重状态的探测生成补充通知。对于那些您希望该过滤器忽略的状态,请取消选择其左侧的选择框。
  7. 通知发送到:在没有过滤的情况下,通知将要发送到的方法。例如,如果在通常情况下接收通知的用户正在休假,您可以将这个用户接收的通知重定向到其他的地址,而其他探测通知将不会改变。
  8. 匹配输出:在这里输入正则表达式来选择准确的输出。如果通知的 "Message:" 部分与正则表达式不匹配,则将不会使用这个过滤器。
  9. 重复:选择过滤器是持续运行还是重复运行。重复运行的过滤器在比过滤器的时间段较短的时间范围内运行多次。例如,重复过滤器可以在过滤器启动和结束的时间段内每小时运行10分钟。非重复的过滤器在过滤器启动和结束间持续运行。
  10. 开始:输入这个过滤开始执行的日期和时间。
  11. 结束:输入这个过滤结束的日期和时间。
  12. 重复周期:循环过滤器的激活时间。该字段仅应用于循环过滤器,在以上指定的「开始」时间开始。对于可以重复使用的过滤,在这个重复时间段外产生的通知将不会被过滤。
  13. 重复频率:过滤器被重复使用的频率。
通知过滤器是不能被删除的。但是,您可以通过将过滤结束的时间设为一个过去的时间来取消这个过滤。(请注意,结束的时间必须等于或晚于开始的时间,否则改变将失败。)另外一个方法是从「激活」页中选择一组过滤,然后点击右下角的 过期通知过滤器 按钮。这些过滤将被取消,并出现在「过期的过滤器」页中。
这个标签页列出了结束的时间已经过去的所有通知过滤。过期的过滤会被永久保存,这样就可以使一个机构重新使用有用的过滤并为故障排除提供历史记录。

4.10.3. 探测套件

探测套件可让您在一个系统或一组系统中配置和应用一个或多个探测。探测套件仅需配置一次就可在任意数量的系统中应用。这为监控用户节省时间而又提高一致性。
要创建并应用探测套件,首先需要创建探测套件本身,然后配置它所包括的探测,最后在选择的系统中应用这个探测套件。
  1. 在监控 ⇒ 探测套件页中选择「创建新探测套件」链接。为这个探测套件输入一个容易区别的名称。您可以选择添加这个套件的简单描述。点 创建探测套件 按钮继续。
  2. 您必须现在就添加组成这个套件的探测。点右上方的「创建新探测」链接。
  3. 第 4.4.2.10.5.2 节 “系统详情 ⇒ 监控” 所示,配置这个探测并点右下方的 创建探测 按钮。重复这个过程直到添加完所有探测。

    注意

    您必须在 RHN Satellite 中正确配置 Sendmail,并在每个应用了该探测套件的用户端系统中安装并运行 rhnmd 守护进程。详情请参阅《RHN Satellite 安装指南》
  4. 添加使用探测套件的系统。点这个屏幕右上方的「将系统添加到探测套件」链接。
  5. 下一页显示了有监控授权的所有系统的列表。点击您希望应用探测套件的系统左面的选择框并点 将系统添加到探测套件 按钮来完成探测套件的创建。
您可以从套件中删除或分离探测。分离探测解除探测和套件的关联,将探测转化成指定系统的指定探测。这意味着对分离探测的改变只影响到那个系统。从套件中删除探测会将它从所有系统中删除。
从探测套件中删除探测:
  1. 从监控 ⇒ 探测套件页中点您需要修改的探测套件的名称。
  2. 选择「探测」子标签页。
  3. 选择您想删除的探测旁的选择框。
  4. 从探测套件中删除探测 按钮。
您还可以从一个探测套件中删除系统。有两种方法可以完成这个任务。第一种方法是从探测套件中将系统剥离。这样做仍然会为系统分配同样的探测,但是您现在可以分别配置这些探测而不会影响到其他系统。关于从一个单独系统中删除探测的信息,请参阅 第 4.4.2.10.5.2 节 “系统详情 ⇒ 监控”
要从探测套件中分离探测:
  1. 「监控」「探测套件」页中点您需要修改的探测套件的名称。
  2. 选择「系统」子标签页。
  3. 选择您想从探测套件中删除的系统旁的选择框。
  4. 从探测套件中分离系统 按钮。
第二种方法是从套件中删除系统。这会从套件中删除系统,并从系统中删除所有运行的探测。

注意

该行动从系统中删除所有探测套件的探测以及所有时间记录和事件日志数据。该行动不可逆转。
要从探测套件中删除系统并从系统中删除所有相关的探测:
  1. 从监控 ⇒ 探测套件页中点您需要修改的探测套件的名称。
  2. 选择「系统」子标签页。
  3. 选择您想从探测套件中删除的系统旁的选择框。
  4. 从探测套件中删除系统 按钮。
最后,作为一个单独的探测,您可以下载包括探测套件信息在内的 CVS 文件。点「监控」「探测套件」页底部的「下载 CSV」下载文件。

4.10.4. 侦察配置 Push

(查看此标签需要监控授权。)显示您的监控系统的状态。在任何时候您更改监控配置,例如添加了一个探测或编辑了一个探测的阈值,您必需重新配置您的监控设施。选择 RHN 服务器的选择框后点 侦察配置 push。这个表格指定了请求的和完成的 push 任务的日期和时间。
点击服务器名称会打开其 Red Hat Network Monitoring Daemon SSH SSH 公钥。这允许您将 SSH 公钥复制到由侦察监控的系统中。这样 Red Hat Network Monitoring Daemon SSH 方可连接到 Satellite。

4.10.5. 常规配置

(查看此标签需要监控授权。)搜集您的监控设施的通用信息。更改本页中的任何内容将会导致重新配置 RHN Satellite 中的监控服务。它还会在所有连接到这个 Satellite,并启用了监控 的 RHN Proxy 中为监控服务调度重启事件。完成后这些服务器中的监控服务会立即重新载入其配置。
通常情况下,在其他字段使用默认设置即可,这是因为它们是从 Satellite 安装中获得的。但是,您可以使用本页中的项来修改您的监控配置。例如:您可以在这里更改邮件交换服务器。在本页中您还可以更改所有来自该 Satellite 的管理邮件的目的地。完成后,点 更新配置
返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat