第 16 章 监控资源
以下章节详细介绍了如何为受管系统配置监控和报告。这包括主机配置、内容视图、合规性、订阅、注册的主机、提升和同步。
16.1. 使用 Red Hat Satellite Content Dashboard
Red Hat Satellite 内容仪表板包含各种小部件,它们提供了主机配置、内容视图、合规性报告、订阅和主机目前注册、升级和同步以及最新通知列表的概述。
在 Satellite Web UI 中,导航到 Monitor > Dashboard 以访问内容仪表板。可以通过单击小部件并将它拖到不同的位置来重新排列仪表板。可用的小部件如下:
- 主机配置状态
配置状态概述以及最后一次报告间隔期间与之关联的主机数量。下表显示了可能的配置状态的描述。
表 16.1. 主机配置状态 图标 状态 描述 执行修改的主机没有错误
在最后报告间隔期间成功执行了修改的主机。
处于错误状态的主机
在最后报告间隔期间检测到错误的主机。
在过去的 35 分钟内报告良好主机
在最后 35 分钟内没有执行任何修改的主机。
待处理的更改的主机
应用某些资源的主机,但 Puppet 已配置为在
noop
模式下运行。没有同步主机
未同步的主机并在最后报告间隔内收到报告。
没有报告的主机
在最后报告间隔期间没有收集到任何报告的主机。
禁用警报的主机
未被监控的主机。
单击特定的配置状态,以查看与之关联的主机。
- 主机配置图
- 饼图显示配置状态的比例以及与其关联的所有主机的比例。
- 最新事件
主机生成的消息列表,包括管理信息、产品和订阅更改以及任何错误。
监控此部分,了解发送到所有用户的全局通知,并检测任何不常见的活动或错误。
- 运行发布(最后 30 分钟)
- 图显示最近 Puppet 间隔期间正在运行的 Puppet 代理的分布,默认为 30 分钟。在这种情况下,每个列都是在 3 分钟期间从客户端接收的大量报告。
- 新主机
- 最近创建的主机的列表。单击主机以获取更多详细信息。
- 任务状态
- 所有当前任务的摘要,按其状态和结果分组。点数字查看对应任务的列表。
- 最新警告/错误任务
- 因警告或错误而停止的最新任务列表。点一个任务来查看更多详情。
- 发现的主机
- Discovery 插件在 provisioning 网络中检测到的所有裸机主机的列表。
- 最新勘误
- 注册到卫星中的主机所有可用勘误表的列表。
- 内容视图
- Satellite 中所有内容视图的列表及其发布状态。
- 同步概述
- 卫星中启用的所有产品或存储库及其同步状态的概述。队列中的所有产品都未同步,或者之前已同步过,本节将列出。
- 主机订阅状态
注册到 Satellite 的主机当前使用的订阅概述。订阅是一个购买的证书,可解锁主机对软件、升级和安全修复的访问。下表显示了订阅可能的状态。
表 16.2. 主机订阅状态 图标 状态 描述 无效
主机已安装产品,但没有正确订阅产品。这些主机需要立即关注。
部分
具有订阅和有效权利的主机,但没有使用其完整的权利。应监控这些主机以确保它们按预期配置。
有效
有有效权限且使用其全部权限的主机。
点订阅类型查看与所选类型订阅关联的主机。
- 订阅状态
- 显示当前订阅总数的概览,显示有效订阅的数量、下一个 120 天内过期的订阅数量,以及最近过期的订阅数量。
- 主机集合
- Satellite 中的所有主机集合及其状态的列表,包括每个主机集合中的内容数量。
- virt-who Configuration Status
从环境中运行的
virt-who
守护进程中收到的报告状态概述。下表显示了可能的状态。表 16.3. virt-who Configuration States 状态 描述 没有报告
未收到报告,因为在 virt-who 配置部署期间发生错误,或者配置尚未部署,或者 virt-who 在计划的时间间隔期间无法连接到 Satellite。
没有更改
未收到报告,因为虚拟机监控程序没有检测到虚拟机的任何更改,或者 virt-who 在计划的时间间隔内无法上传报告。如果您添加了虚拟机,但配置处于 No Change 状态,请检查 virt-who。
确定
在调度间隔期间收到无错误的报告。
配置总数
virt-who 配置总数。
点配置状态查看这个状态的所有配置。
小部件还在"不更改配置"下列出 No Change state 下的三个 最新配置。
- 最新合规性报告
- 最新合规性报告列表。每个合规性报告显示通过多个规则(P)、Failed(F)或其它ed(O)的规则。点主机获取详细的合规性报告。点击策略以了解更多详细信息。
- 合规性报告明细
- 饼图显示合规报告的分布根据其状态。
- Red Hat Insights Actions
- Red Hat Insights 是一个嵌入在 Satellite 中的工具,可检查环境并推荐您可以执行的操作。这个操作分为 4 个类别:可用性、稳定性、性能和安全性。
- Red Hat Insights Risk Summary
表显示了根据风险级别的分发操作。风险级别代表了操作的关键程度以及造成实际问题的可能性。可能的风险等级为: Low、Medium、High 和 Critical。
注意无法更改卫星 Web UI 中显示的日期格式。
16.1.1. 管理任务
红帽卫星保留了所有计划或执行任务的完整日志,如已发布的存储库同步、应用勘误表和内容视图等。要查看日志,请导航到 Monitor > Tasks。
在任务窗口中,您可以搜索特定的任务,查看其状态、详细信息以及自启动起所经过的时间。您还可以取消和恢复一个或多个任务。
这些任务使用 Dynflow 引擎进行管理。远程任务具有超时,可根据需要进行调整。
调整超时设置:
- 在 Satellite Web UI 中,导航到 Administer > Settings。
- 在搜索框中输入 %_timeout 并点 Search。搜索应该返回四个设置,包括描述。
- 在 Value 列中,单击数字旁边的图标进行编辑。
- 输入所需值(以秒为单位),然后单击 Save。
在出现低带宽时,调整 %_finish_timeout 值可能会有所帮助。在出现高延迟时,调整 %_accept_timeout 值可能会有所帮助。
初始化任务后,将检查任务中使用的任何后端服务,如 Candlepin 或 Pulp,以便检查正确运行。如果检查失败,您将收到类似如下的错误:
There was an issue with the backend service candlepin: Connection refused – connect(2).
如果后端服务检查功能造成任何问题,可以禁用它,如下所示。
禁用服务的检查:
- 在 Satellite Web UI 中,导航到 Administer > Settings。
- 在搜索框中输入 check_services_before_actions,然后点击 Search。
- 在 Value 列中,单击图标以编辑该值。
- 从下拉菜单中选择 false。
- 点击 Save。