This documentation is for a release that is no longer maintained
See documentation for the latest supported version 3 or the latest supported version 4.5.10. 机器配置守护进程指标
Machine Config Daemon 是 Machine Config Operator 的一部分。它可在集群的每个节点中运行。Machine Config Daemon 管理每个节点上的配置更改和更新。
5.10.1. 机器配置守护进程指标 复制链接链接已复制到粘贴板!
从 OpenShift Container Platform 4.3 开始,Machine Config Daemon 提供了一组指标。这些指标可以使用 Prometheus Cluster Monitoring 来访问。
下表介绍了这些指标。
						在 * Name* 和 Description 栏中带有 * 标记的指标代表了可能会造成性能问题的严重错误。这些问题可能会阻止更新和升级操作。
					
						虽然有些条目包含获取特定日志的命令,但最完整的日志数据可以通过 oc adm must-gather 命令获得。
					
| 名称 | 格式 | 描述 | 备注 | 
|---|---|---|---|
|   
									  |   
									  |   显示运行 MCD 的操作系统,如 RHCOS 或 RHEL。如果是 RHCOS,则会提供版本信息。  | |
|   
									  |   
									  |   显示在节点中成功进行 SSH 验证的次数。  |   非零值显示可能已经有人手动更改了节点。由于磁盘中的状态和机器配置中定义的状态的不同,这种更改可能会导致不可协调的错误。  | 
|   
									  |   
									  |   在排空失败时出现的错误。*  |   
									虽然排空可能需要多次尝试方可成功,但最终失败的排空会操作会阻止更新进行。 如需进一步调查,请运行以下命令查看日志: 
									  | 
|   
									  |   
									  |   pivot 过程中遇到的日志错误。*  |   pivot 错误可能会导致 OS 升级无法进行。 要进行进一步调查,请运行这个命令访问该节点并查看其所有日志: 
									 
									或者,可以运行这个命令只查看来自  
									  | 
|   
									  |   
									  |   指定节点的 Machine Config Daemon 状态。可能的状态是 "Done" 、"Working" 和 "Degraded"。如果是 "Degraded",则会包括原因。  |   如需进一步调查,请运行以下命令查看日志: 
									  | 
|   
									  |   
									  |   日志 kubelet 健康失败。*  |   这应该为空,故障计数为 0。如果失败数超过 2,则代表超过了阈值。这表示 kubelet 健康可能存在问题。 要进行进一步调查,请运行这个命令访问该节点并查看其所有日志: 
									  | 
|   
									  |   
									  |   重启失败以及相应错误的日志。*  |   这应该为空,代表重启成功。 如需进一步调查,请运行以下命令查看日志: 
									  | 
|   
									  |   
									  |   记录配置更新的成功或失败以及相应的错误。  |   
									预期的值为  如需进一步调查,请运行以下命令查看日志: 
									  |