10.6.5. 软隔离主机
由于意外问题,主机有时可能会变得不响应,但 VDSM 无法响应请求,但依赖于 VDSM 的虚拟机仍保持有效并可访问。在这些情况下,重新启动 VDSM 将返回到响应状态并解决这个问题。
"SSH Soft 隔离"是一个进程,管理器尝试在不响应的主机上通过 SSH 重新启动 VDSM。如果管理器无法通过 SSH 重新启动 VDSM,则隔离的责任将在配置了外部隔离代理时进入外部隔离代理。
通过 SSH 进行软隔离的工作方式如下:必须在主机上配置和启用隔离,并且数据中心必须存在有效的代理主机(第二个主机,处于 UP 状态)。当 Manager 和主机间的连接超时时,会出现以下情况:
- 在第一个网络失败时,主机的状态将变为"连接"。
- 然后,管理器尝试询问 VDSM 以获得其状态,或者等待主机上负载确定的时间间隔。用于确定间隔长度的公式由配置值 TimeoutToResetVdsInSeconds 配置(默认为 60 秒)+ [DelayResetPerVmInSeconds (默认为 0.5 秒)]*(在主机上运行虚拟机的数量)+ [DelayResetForSpmInSeconds (默认为 20 秒)] * (如果主机为 SPM)运行。为了给 VDSM 给予响应的最大时间,经理可选择上述两个选项的更长时间(三个尝试检索 VDSM 的状态或以上公式决定的间隔)。
-
如果主机没有响应该间隔经过的,则
vdsm restart
将通过 SSH 执行。 -
如果
vdsm 重启
在主机和 Manager 之间重新建立连接时无法成功,则主机的状态会变为Non Responsive
,如果配置了电源管理,则隔离将移交给外部隔离代理。
注意
通过 SSH 进行软隔离可以在没有配置电源管理的主机上执行。这与"隔离"不同,只能在配置了电源管理的主机上执行。