10.6. 主机弹性
10.6.1. 主机高可用性
Red Hat Virtualization Manager 使用隔离来保持集群中的主机响应。不响应的主机 与非 操作主机 不同。非 Operational 主机可由 Manager 进行通信,但具有不正确的配置,例如缺少的逻辑网络。不响应的主机 不能与管理器通信。
隔离可让集群响应意外的主机故障,并强制进行节能、负载平衡和虚拟机可用性策略。您应该为主机的电源管理设备配置隔离参数,并从时间测试其正确性。在隔离操作中,重启后不响应的主机,如果主机没有在指定时间内返回活动状态,则仍然保持不响应的等待的手动干预和故障排除。
要自动检查隔离参数,您可以配置 PMHealthCheckEnabled
(默认为false)和 PMHealthCheckIntervalInSec
(默认为 3600 sec)engine-config 选项。
当设置为 true 时,PackpmHealthCheckEnabled
会按照 PMHealthCheckIntervalInSec
指定的时间间隔检查所有主机代理,并在检测到问题时引发警告。有关配置 engine-config 选项的更多信息,请参阅 第 22.2.2 节 “engine-config 命令的语法”。
虚拟机管理器可通过 Red Hat Virtualization Manager 在代理主机、代理主机或管理门户中手动执行。在不响应的主机上运行的所有虚拟机均已停止,并且高可用性虚拟机在不同的主机上启动。电源管理操作至少需要两台主机。
管理器启动后,它会自动尝试隔离在静默时间(默认为 5 分钟)后启用了电源管理的不响应的主机。可以通过更新 DisableFenceAtStartupInSec
engine-config 选项来配置静默时间。
DisableFenceAtStartupInSec
engine-config 选项有助于防止管理器在启动时试图隔离主机的场景。这在数据中心中断后发生,因为主机的引导过程通常比 Manager 引导过程长。
可以使用电源管理参数自动隔离主机主机,或者右键点主机并使用菜单上的选项来手动隔离。
如果主机运行具有高可用性的虚拟机,则必须启用和配置电源管理。