第 15 章 监控资源
以下章节详细介绍了如何为受管系统配置监控和报告。这包括主机配置、内容视图、合规性、订阅、注册的主机、提升和同步。
15.1. 使用 Red Hat Satellite 内容仪表板
Red Hat Satellite 内容控制面板包含各种小部件,它们概述了主机配置、内容视图、合规性报告、订阅和主机当前注册、提升和同步以及最新通知的列表。
在 Satellite Web UI 中,导航到 Monitor > Dashboard 以访问内容仪表板。可以通过单击小部件并将其拖动到不同的位置来重新安排仪表板。可用的小部件如下:
- 主机配置状态
配置状态以及最后一次报告间隔期间与其关联的主机数量概述。下表显示了可能的配置状态的描述。
表 15.1. 主机配置状态 图标 状态 描述 执行修改的主机没有错误
在最后一次报告间隔内成功执行修改的主机。
处于错误状态的主机
在最后报告间隔期间检测到错误的主机。
在最后的 35 分钟内报告良好主机
没有错误的主机不会在最后的 35 分钟内执行任何修改。
待处理的主机
应用某些资源的主机,但 Puppet 配置为在
noop
模式下运行。没有同步主机
未同步且报告的主机在最后报告间隔期间没有被收到。
没有报告的主机
在最后报告间隔期间没有收集到任何报告的主机。
禁用警报的主机
未监控的主机。
单击特定的配置状态,以查看与其关联的主机。
- 主机配置图表
- pie 图显示配置状态的比例以及与其关联的所有主机的百分比。
- 最新事件
主机生成的消息列表,包括管理信息、产品和订阅更改以及任何错误。
监控本节以了解发送到所有用户的全局通知,并检测任何不常见的活动或错误。
- 运行分发(最后 30 分钟)
- 图显示在最后的 puppet 间隔(默认为 30 分钟)期间运行的 Puppet 代理的分发。在这种情况下,每列代表在 3 分钟内从客户端接收的多个报告。
- 新主机
- 最近创建的主机列表。单击主机以获取更多详细信息。
- 任务状态
- 所有当前任务的摘要,按状态和结果分组。点数字查看对应的任务列表。
- 最新警告/错误任务
- 由于警告或错误而停止的最新任务列表。点任务查看更多详情。
- 发现的主机
- 通过 Discovery 插件在 provisioning 网络中检测到的所有裸机主机的列表。
- 最新勘误
- 用于注册到 Satellite 的主机的所有勘误的列表。
- 内容视图
- Satellite 中所有内容视图的列表及其发布状态。
- 同步概述
- Satellite 中启用的所有产品或存储库的概述及其同步状态。所有位于同步队列的产品都未同步,或之前已同步的所有产品均将在本节中列出。
- 主机订阅状态
当前由注册到 Satellite 的主机使用的订阅概述。订阅是一个购买的证书,用于解锁对主机的软件、升级和安全修复的访问。下表显示了订阅的可能状态。
表 15.2. 主机订阅状态 图标 状态 描述 无效
已安装产品但没有正确订阅的主机。这些主机需要立即关注。
部分
具有订阅和有效权利的主机,但不全部使用其全部权利。应监控这些主机以确保它们按预期配置。
valid
有有效权限且使用其全部权限的主机。
点订阅类型查看与所选类型订阅关联的主机。
- 订阅状态
- 当前订阅概述,其中显示了有效订阅的数量、下一个 120 天后过期的订阅数以及最近过期的订阅数。
- Host Collections
- Satellite 中的所有主机聚合的列表及其状态,包括每个主机集合中的内容主机数量。
- virt-who 配置状态
从环境中运行的
virt-who
守护进程接收的报告状态概述。下表显示了可能的状态。表 15.3. virt-who 配置状态 状态 描述 没有报告
没有收到报告,因为 virt-who 配置部署期间发生了错误,或者配置尚未部署,或者 virt-who 在调度的间隔期间无法连接到 Satellite。
没有更改
没有收到报告,因为虚拟机监控程序没有检测到虚拟机的任何更改,或者 virt-who 在调度间隔内无法上传报告。如果您添加了虚拟机,但配置处于 No Change 状态,请检查 virt-who 是否正在运行。
确定
在调度间隔期间收到无错误的报告。
总配置
virt-who 配置总数。
点配置状态来查看处于此状态的所有配置。
小部件还会在 Latest Configuration Without Change 下列出 No Change 状态的三个最新的配置。
- 最新合规性报告
- 最新合规性报告列表。每个合规性报告显示传递的多个规则(P)、失败(F)或其他合规性报告(O)。单击主机以了解详细合规性报告。点击该策略以了解更多有关该策略的详细信息。
- 合规性报告明细
- pie chart 根据其状态显示合规性报告的分发。
- Red Hat Insights 操作
- Red Hat Insights 是一个嵌入在 Satellite 中的工具,用于检查环境和推荐操作。该操作分为 4 个类别:可用性、稳定性、性能和安全性。
- Red Hat Insights 风险概述
表中根据风险级别显示操作的分布。风险级别代表了操作的关键程度,以及导致实际问题的可能性。可能的风险级别有: Low、Medium、High 和 Critical。
注意无法更改 Satellite Web UI 中显示的日期格式。
15.1.1. 管理任务
Red Hat Satellite 保留所有计划或执行的任务的完整日志,如存储库同步、应用的勘误和内容视图。要查看日志,请导航到 Monitor > Tasks。
在 Task 窗口中,您可以搜索特定的任务,查看其状态、详情和过期时间。您还可以取消和恢复一个或多个任务。
这些任务通过 Dynflow 引擎进行管理。远程任务具有可根据需要调整的超时。
要调整超时设置:
- 在 Satellite Web UI 中,导航到 Administer > Settings。
- 在搜索框中输入 %_timeout,然后点 搜索。搜索应返回四个设置,包括描述。
- 在 Value 列中,点数字旁边的图标编辑它。
- 输入所需值(以秒为单位),然后单击 Save。
在带宽较低时,调整 %_finish_timeout 值可能会帮助。在延迟高时,调整 %_accept_timeout 值可能会帮助。
初始化任务时,将检查任务中使用的任何后端服务,如 Candlepin 或 Pulp。如果检查失败,您会收到类似如下的错误:
There was an issue with the backend service candlepin: Connection refused – connect(2).
如果后端服务检查功能导致任何问题,则可以禁用它,如下所示。
禁用检查服务:
- 在 Satellite Web UI 中,导航到 Administer > Settings。
- 在搜索框中输入 check_services_before_actions,然后点 Search。
- 在 Value 列中,点图标编辑值。
- 从下拉菜单中选择 false。
- 点击 Save。