第 17 章 监控资源
以下章节详细介绍了如何为受管系统配置监控和报告。这包括主机配置、内容视图、合规性、订阅、注册的主机、提升和同步。
17.1. 使用 Red Hat Satellite 内容仪表板
Red Hat Satellite 内容仪表板包含各种小部件,它们提供了主机配置、内容视图、合规性报告、订阅和主机当前注册、提升和同步以及最新通知列表的概述。
在 Satellite Web UI 中,进入到 Monitor > Dashboard 以访问内容仪表板。可以通过单击小部件并将它拖动到不同的位置来重新安排仪表板。可用的小部件如下:
- 主机配置状态
在最后报告间隔期间配置状态以及与其关联的主机数量的概述。下表显示了可能的配置状态的描述。
表 17.1. 主机配置状态 图标 状态 描述 执行修改的主机没有错误
在最后报告间隔期间成功执行修改的主机。
处于错误状态的主机
在最后报告间隔期间检测到错误的主机。
最后一次 35 分钟内的良好主机报告
没有错误的主机在最后 35 分钟内不执行任何修改。
处于待定更改的主机
应用某些资源但 Puppet 配置为在
noop
模式下运行的主机。不同步主机
没有同步的主机,在最后报告间隔期间不会收到报告。
没有报告的主机
在最后报告间隔期间没有收集到任何报告的主机。
禁用警报的主机
未监控的主机。
单击特定的配置状态,以查看与其关联的主机。
- 主机配置图
- pie 图表显示配置状态的比例以及与其关联的所有主机的百分比。
- 最新事件
主机生成的消息列表,包括管理信息、产品和订阅更改以及任何错误。
监控此部分,了解发送给所有用户的全局通知,并检测任何异常活动或错误。
- 运行分发(最后 30 分钟)
- 图显示在最后 puppet 间隔期间运行的 Puppet 代理的分发,默认为 30 分钟。在这种情况下,每个列表示在 3 分钟内从客户端接收的多个报告。
- 新主机
- 最近创建的主机的列表。单击主机以获取更多详细信息。
- 任务状态
- 所有当前任务的概述,按状态和结果分组。点数字查看对应任务列表。
- 最新警告/错误任务
- 最新任务列表,它们因为警告或错误而停止。点一个任务查看更多详情。
- 发现的主机
- Discovery 插件在 provisioning 网络中检测到的所有裸机主机列表。
- 最新勘误
- 适用于注册到 Satellite 的主机的所有勘误的列表。
- 内容视图
- Satellite 中所有内容视图的列表及其发布状态。
- 同步概述
- Satellite 中启用的所有产品或存储库及其同步状态的概述。本节列出了队列中用于同步的所有产品,且未同步或之前已同步。
- 主机订阅状态
现在,已由注册到 Satellite 的主机使用的订阅概述。订阅是购买的证书,可以解锁对主机软件、升级和安全修复的访问。下表显示了订阅可能的状态。
表 17.2. 主机订阅状态 图标 状态 描述 无效
安装了产品但没有正确订阅的主机。这些主机需要立即关注。
部分
具有订阅及有效权利但没有使用其全部权利的主机。应监控这些主机以确保它们按预期配置。
valid
有有效权限且使用其全部权限的主机。
点订阅类型查看与所选类型订阅关联的主机。
- 订阅状态
- 显示当前订阅总数的概述,显示有效订阅数量、在下一个 120 天后过期的订阅数量,以及最近已过期的订阅数量。
- 主机集合
- Satellite 中所有主机集合及其状态的列表,包括每个主机集合中的内容主机数量。
- virt-who 配置状态
从环境中运行的
virt-who
守护进程接收的报告状态概述。下表显示了可能的状态。表 17.3. virt-who 配置状态 状态 描述 没有报告
没有收到报告,因为 virt-who 配置部署期间发生错误,或者尚未部署配置,或者 virt-who 在调度间隔期间无法连接到 Satellite。
没有更改
未收到报告,因为虚拟机监控程序没有检测到虚拟机上的任何更改,或者 virt-who 在调度间隔内无法上传报告。如果您添加了虚拟机,但配置处于 No Change 状态,请检查 virt-who 是否正在运行。
确定
在调度间隔期间收到无错误的报告。
配置总数
virt-who 配置总数。
点击配置状态查看此状态下的所有配置。
该小部件还列出了 Latest Configuration (不更改 )下 No Change state 中的三个最新配置。
- 最新合规性报告
- 最新合规性报告列表。每个合规性报告都显示通过(P)、失败(F)或其他ed (O)的多个规则。单击详细合规性报告的主机。单击策略以获取该策略的详情。
- 合规性报告明细
- pie 图表显示合规报告的状态分布。
- Red Hat Insights 操作
- Red Hat Insights 是一个嵌入在 Satellite 中的工具,它检查环境并推荐您可以执行的操作。这些操作分为 4 个类别:可用性、稳定性、性能和安全性。
- Red Hat Insights 风险概述
表显示根据风险级别的操作分发。风险级别代表操作的关键,以及导致实际问题的可能性。可能的风险级别有: Low, Medium, High, 和 Critical。
注意无法更改 Satellite Web UI 中显示的日期格式。
17.1.1. 管理任务
Red Hat Satellite 保留所有计划或已执行的任务的完整日志,如发布存储库同步、勘误和内容视图。要查看日志,请导航到 Monitor > Satellite Tasks > Tasks。
在 Task 窗口中,您可以搜索特定任务,查看其状态、详情以及启动后经过的时间。您还可以取消和恢复一个或多个任务。
这些任务使用 Dynflow 引擎进行管理。远程任务有一个超时,可以根据需要调整。
调整超时设置
- 在 Satellite Web UI 中,进入到 Administer > Settings。
- 在搜索框中输入 %_timeout 并点 Search。搜索应返回四个设置,包括描述。
- 在 Value 列中,单击数字旁边的图标来编辑它。
- 输入所需值(以秒为单位),然后单击 Save。
调整 %_finish_timeout 值在低带宽时可能有所帮助。调整 %_accept_timeout 值在出现高延迟时可能有所帮助。
初始化任务后,将检查任务中使用的任何后端服务,如 Candlepin 或 Pulp。如果检查失败,您将收到类似如下的错误:
There was an issue with the backend service candlepin: Connection refused – connect(2).
如果后端服务检查功能导致了任何问题,则可以将其禁用,如下所示:
禁用对服务的检查
- 在 Satellite Web UI 中,进入到 Administer > Settings。
- 在搜索框中输入 check_services_before_actions,然后单击 Search。
- 在 Value 列中,点图标编辑值。
- 从下拉菜单中选择 false。
- 点击 Save。