4.5. 软隔离主机
主机有时可能会因为意外问题而变得不响应,而 VDSM 却无法响应请求,但 VDSM 依赖于 VDSM 的虚拟机仍然处于活动状态且可以访问。在这些情况下,重启 VDSM 将 VDSM 返回到响应的状态,并解决这个问题。
"SSH Soft 隔离"是一个过程,管理器尝试在不响应的主机上通过 SSH 重新启动 VDSM。如果 Manager 无法通过 SSH 重启 VDSM,则隔离的职责会属于外部隔离代理(如果配置了外部隔离代理)。
通过 SSH 软隔离工作,如下所示。在主机上必须配置和启用隔离,并且必须存在有效的代理主机(第二个主机,处于 UP 状态)。当 Manager 和主机间的连接超时时,会出现以下情况:
- 在第一个网络失败时,主机的状态将变为"连接"。
- 然后,管理器使三个尝试询问 VDSM 的状态,或等待由主机上负载决定的间隔。决定间隔长度的公式由配置值 TimeoutToResetVdsInSeconds(默认为 60 秒)+ [DelayResetPerVmInSeconds(默认为 0.5 秒)]*(在主机上运行虚拟机的数量)+ [DelayResetForSpmInSeconds(默认为 20 秒)*(如果主机运行着 0.5 秒)或 SPM(如果是 20 秒)。为 VDSM 授予 VDSM 响应的最大时间量,管理器选择上述两个选项的较长时间(three 会尝试检索 VDSM 的状态或以上公式确定的时间间隔)。
-
如果主机在已经过该间隔时没有响应,则
vdsm 重启
会通过 SSH 执行。 -
如果
vdsm 重启
无法在重新建立主机与管理器之间的连接时成功,则主机的状态将变为无响应
,如果配置了电源管理,则隔离会移交给外部隔离代理。
注意
在没有配置电源管理的主机上,可以对 SSH 进行软隔离。这与"隔离"不同:只能在配置了电源管理的主机上执行隔离。