第 3 章 维护从失败 Compute 节点清空实例的过程
Red Hat OpenStack Services on OpenShift (RHOSO)对于 Compute 实例(Instance HA)的高可用性,可帮助您管理从故障 Compute 节点清空实例的过程。但是,该服务需要您的超级部门,并且当需要采取行动时。
Instance HA 服务会忽略您有意禁用的任何 Compute 节点。您可以按照以下原因,特意禁用 Compute 节点:
- 您可以有意禁用健康的 Compute 节点,以确保有足够的容量来撤离失败的 Compute 节点的实例。如需更多信息,请参阅 保留健康的 Compute 节点。
- 您可以有意禁用必须维护或配置的 Compute 节点,因为 Compute 节点重新引导或关闭时不会通知 Instance HA 服务。如需更多信息 ,请参阅禁用 Compute 节点的撤离。
-
您可以通过将
DISABLEDInstance HA 服务参数设置为true来防止 Instance HA 服务撤离失败的 Compute 节点。在这个模式中,Instance HA 服务监控您的计算节点,并记录有失败但不再做任何操作。如需更多信息,请参阅 编辑 Instance HA 服务参数。 -
您可以通过将
LEAVE_DISABLEDInstance HA 服务参数设置为true来防止 Instance HA 服务重新启用失败的 Compute 节点,因为故障可能会指示有故障的硬件,而您不希望 Compute 节点再次失败。 - 您可以查看 Instance HA 服务生成的日志文件,以对此进程进行故障排除。如需更多信息,请参阅对 Instance HA 服务进行故障排除。
-
当 Compute 节点的撤离缓慢或失败时,您可以手动将
Forced Down标志设置为false。如需更多信息,请参阅 Rehabilitating evacuated Compute nodes。
3.1. 禁用 Compute 节点的撤离 复制链接链接已复制到粘贴板!
当 Compute 节点被重启或关闭时,不会通知 Red Hat OpenStack Services on OpenShift (RHOSO) for Compute 实例(Instance HA)服务。因此,您必须禁用维护或配置的 Compute 节点的撤离。
流程
如果您计划配置或维护有限数量的 Compute 节点,您可以单独禁用每个 Compute 节点。例如,您可以使用以下命令禁用名为
compute-7的 Compute 节点进行维护:$ openstack compute service set --disable --disable-reason "maintenance" compute-7 nova-compute注意您可以使用 optional
--disable-reason参数指定禁用 Compute 节点的原因。不要使用在您的描述中保留的单词,因为 Instance HA 服务使用这个词语来识别有意禁用的健康 Compute 节点,以便为撤离实例提供保留容量。如需更多信息,请参阅 保留健康的 Compute 节点。-
如果您计划配置或维护大量 Compute 节点,您可以通过将
DISABLEDInstance HA 服务参数设置为true来临时禁用 Instance HA 服务。如需更多信息,请参阅 编辑 Instance HA 服务参数。