第 3 章 对自托管引擎部署进行故障排除
要确认自托管引擎是否已部署运行 hosted-engine --check-deployed。只有尚未部署自托管引擎,才会显示错误。
3.1. Manager 虚拟机故障排除
过程 3.1. Manager 虚拟机故障排除
- 运行 hosted-engine --vm-status 来检查 Manager 虚拟机的状态。注意对 Manager 虚拟机所做的任何更改都将花费大约 20 秒时间才能反映到 status 命令输出中。如果 Manager 虚拟机已启动并正常运行,您会看到以下输出:
--== Host 1 status ==-- Status up-to-date : True Hostname : hypervisor.example.com Host ID : 1 Engine status : {"health": "good", "vm": "up", "detail": "up"} Score : 3400 stopped : False Local maintenance : False crc32 : 99e57eba Host timestamp : 248542
- 如果不良或 停机,请启用全局维护模式,以便主机不再由 HA 服务管理。
- 在管理门户中,右键单击 Manager 虚拟机,然后选择 Enable Global HA Maintenance。
- 您还可以从命令行设置维护模式:
# hosted-engine --set-maintenance --mode=global
- 如果 Manager 虚拟机停机,请启动 Manager 虚拟机。如果虚拟机已启动,请跳过这一步。
# hosted-engine ---vm-start
- 设置控制台密码:
# hosted-engine --add-console-password
- 连接到控制台。出现提示时,输入上一步中设置的密码。如需了解更多控制台选项,请参阅 https://access.redhat.com/solutions/2221461。
# hosted-engine --console
- 确定为什么 Manager 虚拟机停机或处于错误健康状态。检查
/var/log/messages
和/var/log/ovirt-engine/engine.log
。修复问题后,重启 Manager 虚拟机。 - 以 root 用户身份登录 Manager 虚拟机,验证 ovirt-engine 服务是否正在运行:
# systemctl status ovirt-engine.service
- 确保 Manager 虚拟机启动并运行后,关闭控制台会话并禁用维护模式以再次启用 HA 服务:
# hosted-engine --set-maintenance --mode=none
其他故障排除命令:
重要
如果您认为需要运行任何这些命令对自托管引擎环境进行故障排除,请联系红帽支持团队。
- hosted-engine --reinitialize-lockspace :当 sanlock 锁定空间损坏时使用此命令。确保已启用全局维护模式,并在重新初始化 sanlock 锁定空间前停止 Manager 虚拟机。
- hosted-engine --clean-metadata :从全局状态数据库中删除主机的代理元数据。这可以使得所有其他主机忘记这个主机。确保目标主机已停机,并且启用了全局维护模式。
- hosted-engine --check-liveliness :该命令检查 ovirt-engine 服务的 livelines 页面。您还可以在 Web 浏览器中连接到
https://engine-fqdn/ovirt-engine/services/health/
来检查。 - hosted-engine --connect-storage :该命令指示 VDSM 准备主机和管理器虚拟机所需的所有存储连接。这通常在自托管引擎部署期间在后端运行。如果您需要运行此命令来排除存储问题,请确保已启用全局维护模式。