第 16 章 故障排除
有些情况下,辅助安装程序无法开始安装,或者集群无法正确安装。在这些事件中,了解可能的故障模式以及如何对故障进行故障排除非常有用。
16.1. 发现 ISO 问题故障排除
Assisted Installer 使用 ISO 镜像来运行将主机注册到集群的代理,并在尝试安装 OpenShift 前执行硬件和网络验证。您可以按照以下步骤排除与主机发现相关的问题。
使用发现 ISO 镜像启动主机后,辅助安装程序发现主机并在 Assisted Service web 控制台中显示它。如需了解更多详细信息,请参阅配置发现镜像。
16.1.1. 验证发现代理是否正在运行
先决条件
- 已使用 API 创建基础架构环境,或使用 Web 控制台创建集群。
- 已使用基础架构环境发现 ISO 引导主机,主机无法注册。
- 您有到主机的 SSH 访问权限。
- 在生成发现 ISO 前,在"添加主机"对话框中提供了 SSH 公钥,以便您可以在无需密码的情况下通过 SSH 连接到机器。
流程
- 验证您的主机已开机。
- 如果您选择了 DHCP 网络,检查 DHCP 服务器是否已启用。
- 如果您选择了 静态 IP、网桥和绑定网络,请检查您的配置是否正确。
验证您可以使用 SSH、一个控制台(如 BMC)或虚拟机控制台来访问主机机器:
$ ssh core@<host_ip_address>
如果没有存储在默认目录中,您可以使用 a
-i
参数指定私钥文件。$ ssh -i <ssh_private_key_file> core@<host_ip_address>
如果您无法通过 SSH 连接到主机,则主机会在引导过程中失败,或者无法配置网络。
登录后,您应该看到这个信息:
登录示例
如果没有看到这个消息,这意味着主机没有使用 Assisted Installer ISO 镜像引导。确保正确配置了引导顺序(主机应该从 live-ISO 启动一次)。
+ .检查代理服务日志:
+
$ sudo journalctl -u agent.service
+ 在以下示例中,错误表示存在网络问题:
+ .example 代理服务日志屏幕截图
+ 如果拉取代理镜像出现错误,请检查代理设置。验证主机是否已连接到网络。您可以使用 nmcli
来获取有关网络配置的额外信息。
16.1.2. 验证代理可以访问 assisted-service
先决条件
- 已使用 API 创建 Infrastructure 环境,或使用 Web 控制台创建集群。
- 已使用基础架构环境发现 ISO 引导主机,主机无法注册。
- 您验证了发现代理正在运行。
流程
检查代理日志以验证代理可以访问 Assisted Service:
$ sudo journalctl TAG=agent
以下示例中的错误表示代理无法访问 Assisted Service。
代理日志示例
检查您为集群配置的代理设置。如果配置,代理必须允许访问 Assisted Service URL。