第 15 章 故障排除
有些情况下,辅助安装程序无法开始安装,或者集群无法正确安装。在这些事件中,了解可能的故障模式以及如何对故障进行故障排除非常有用。
15.1. 发现 ISO 问题故障排除 复制链接链接已复制到粘贴板!
Assisted Installer 使用 ISO 镜像来运行将主机注册到集群的代理,并在尝试安装 OpenShift 前执行硬件和网络验证。您可以按照以下步骤排除与主机发现相关的问题。
使用发现 ISO 镜像启动主机后,辅助安装程序发现主机并在 Assisted Service web 控制台中显示它。如需了解更多详细信息,请参阅配置发现镜像。
15.1.1. 验证发现代理是否正在运行 复制链接链接已复制到粘贴板!
先决条件
- 已使用 API 创建基础架构环境,或使用 Web 控制台创建集群。
- 已使用基础架构环境发现 ISO 引导主机,主机无法注册。
- 您有到主机的 SSH 访问权限。
- 在生成发现 ISO 前,在"添加主机"对话框中提供了 SSH 公钥,以便您可以在无需密码的情况下通过 SSH 连接到机器。
流程
- 验证您的主机已开机。
- 如果您选择了 DHCP 网络,检查 DHCP 服务器是否已启用。
- 如果您选择了 静态 IP、网桥和绑定网络,请检查您的配置是否正确。
验证您可以使用 SSH、一个控制台(如 BMC)或虚拟机控制台来访问主机机器:
ssh core@<host_ip_address>
$ ssh core@<host_ip_address>
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 如果没有存储在默认目录中,您可以使用
-i
参数指定私钥文件。ssh -i <ssh_private_key_file> core@<host_ip_address>
$ ssh -i <ssh_private_key_file> core@<host_ip_address>
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 如果您无法通过 SSH 连接到主机,则主机会在引导过程中失败,或者无法配置网络。
登录后,您应该看到这个信息:
登录示例
如果没有看到这条消息,这意味着主机没有使用 assisted-installer ISO 引导。确保正确配置了引导顺序(主机应该从 live-ISO 启动一次)。
检查代理服务日志:
sudo journalctl -u agent.service
$ sudo journalctl -u agent.service
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 在以下示例中,错误表示存在网络问题:
代理服务日志的代理服务日志截图示例
如果拉取代理镜像出现错误,请检查代理设置。验证主机是否已连接到网络。您可以使用
nmcli
来获取有关网络配置的额外信息。
15.1.2. 验证代理可以访问 assisted-service 复制链接链接已复制到粘贴板!
先决条件
- 已使用 API 创建 Infrastructure 环境,或使用 Web 控制台创建集群。
- 已使用基础架构环境发现 ISO 引导主机,主机无法注册。
- 您验证了发现代理正在运行。
流程
检查代理日志以验证代理可以访问 Assisted Service:
sudo journalctl TAG=agent
$ sudo journalctl TAG=agent
Copy to Clipboard Copied! Toggle word wrap Toggle overflow 以下示例中的错误表示代理无法访问 Assisted Service。
代理日志示例
检查您为集群配置的代理设置。如果配置,代理必须允许访问 Assisted Service URL。