第 18 章 监控资源
以下章节详细介绍了如何为受管系统配置监控和报告。这包括主机配置、内容视图、合规性、注册的主机、提升和同步。
18.1. 使用 Red Hat Satellite 内容仪表板 复制链接链接已复制到粘贴板!
Red Hat Satellite 内容仪表板包含各种小部件,它们提供主机配置、内容视图、合规性报告和当前注册的主机、提升和同步以及最新通知列表。
在 Satellite Web UI 中,进入到 Monitor > Dashboard 以访问内容仪表板。单击小部件并将其拖到不同的位置,可以重新安排仪表板。可用的小部件如下:
- 主机配置状态
配置状态概述以及在最后报告间隔期间与其关联的主机数量。下表显示了可能的配置状态的描述。
Expand 表 18.1. 主机配置状态 图标 状态 描述 已执行修改的主机且没有错误
在最后报告间隔期间成功执行修改的主机。
处于错误状态的主机
在最后报告间隔期间检测到错误的主机。
最后 35 分钟内的良好主机报告
主机没有错误,在最后 35 分钟内执行任何修改。
待处理的更改的主机
应用某些资源但 Puppet 配置为以
noop
模式运行的主机。没有同步主机
未同步的主机,在最后报告间隔期间没有收到报告。
没有报告的主机
在最后报告间隔期间没有收集到任何报告的主机。
禁用警报的主机
未监控的主机。
单击特定的配置状态,以查看与之关联的主机。
- 主机配置图
- pie 图显示配置状态的比例以及与其关联的所有主机的百分比。
- 最新事件
主机生成的消息列表,包括管理信息、产品更改和任何错误。
监控本节是否有发送到所有用户的全局通知,并检测任何异常活动或错误。
- 运行发布(最后 30 分钟)
- 图显示在最后的 puppet 间隔期间运行的 Puppet 代理分布,默认为 30 分钟。在这种情况下,每个列代表在 3 分钟期间从客户端接收的多个报告。
- 新主机
- 最近创建的主机的列表。单击主机以获取更多详细信息。
- 任务状态
- 所有当前任务的摘要,按其状态和结果分组。点数字查看对应的任务列表。
- 最新警告/错误任务
- 因警告或错误而停止的最新任务的列表。点任务查看更多详情。
- 发现的主机
- 通过 Discovery 插件在 provisioning 网络中检测到的所有裸机主机的列表。
- 最新勘误
- 用于注册到 Satellite 的主机的所有勘误的列表。
- 内容视图
- Satellite 中所有内容视图的列表及其发布状态。
- 同步概述
- 概述在 Satellite 中启用的所有产品或存储库,以及它们的同步状态。本节列出了同步队列中的所有产品。
- 主机集合
- Satellite 中的所有主机集合的列表及其状态,包括每个主机集合中的内容主机数量。
- virt-who 配置状态
从在环境中主机上运行的
virt-who
守护进程接收的报告状态概述。下表显示了可能的状态。Expand 表 18.2. virt-who 配置状态 状态 描述 没有报告
未收到报告,因为 virt-who 配置部署期间发生错误,或者尚未部署配置,或者 virt-who 在调度的间隔期间无法连接到 Satellite。
没有更改
没有收到报告,因为虚拟机监控程序没有检测到虚拟机上的任何更改,或者 virt-who 无法在调度的时间间隔期间上传报告。如果您添加了虚拟机,但配置处于 No Change 状态,请检查 virt-who 是否正在运行。
确定
在调度间隔期间收到无错误的报告。
配置总数
virt-who 配置的总数。
点配置状态查看此状态中的所有配置。
小部件还会在 Latest Configuration Without Change 下的 No Change 状态列出了三个最新的配置。
- 最新合规性报告
- 最新合规性报告列表。每个合规性报告都显示许多通过(P)、失败(F)或其他规则(O)。单击主机以获取详细的合规性报告。点策略了解该策略的详情。
- 合规性报告明细
- pie 图显示合规报告的分布根据其状态。
- Red Hat Insights Actions
- Red Hat Insights 是一个嵌入在 Satellite 中的工具,用于检查环境并推荐您可以执行的操作。操作分为 4 个类别:可用性、稳定性、性能和安全性。
- Red Hat Insights 风险概述
表根据风险级别显示操作的分布。风险级别代表了操作的关键程度以及导致实际问题的可能性。可能的风险级别为: Low、Medium、High 和 Critical。
注意无法更改 Satellite Web UI 中显示的日期格式。
18.1.1. 管理任务 复制链接链接已复制到粘贴板!
Red Hat Satellite 保持发布所有计划或执行的任务的完整日志,如存储库同步、应用勘误表和内容视图。要查看日志,请导航到 Monitor > Satellite Tasks > Tasks。
在 Task 窗口中,您可以搜索特定的任务,查看其状态、详情以及自启动的时间。您还可以取消和恢复一个或多个任务。
这些任务使用 Dynflow 引擎进行管理。远程任务有一个超时,可以根据需要进行调整。
调整超时设置
- 在 Satellite Web UI 中,进入到 Administer > Settings。
- 在搜索框中输入 %_timeout,然后单击 Search。搜索应返回四个设置,包括描述。
- 在 Value 列中,点数字旁边的图标进行编辑。
- 输入所需值(以秒为单位),然后单击 Save。
在低带宽的情况下,调整 %_finish_timeout 值可能会有所帮助。在高延迟时,调整 %_accept_timeout 值可能会有所帮助。
初始化任务时,将检查任务中使用的任何后端服务,如 Candlepin 或 Pulp,以确保正常运行。如果检查失败,您将收到类似如下的错误:
There was an issue with the backend service candlepin: Connection refused – connect(2).
There was an issue with the backend service candlepin: Connection refused – connect(2).
如果后端服务检查功能导致任何问题,可以禁用它,如下所示。
禁用服务的检查
- 在 Satellite Web UI 中,进入到 Administer > Settings。
- 在搜索框中输入 check_services_before_actions,然后单击 搜索。
- 在 Value 列中,点图标编辑值。
- 从下拉菜单中选择 false。
- 点击 Save。