第 3 章 维护从失败 Compute 节点清空实例的过程


Red Hat OpenStack Services on OpenShift (RHOSO)对于 Compute 实例(Instance HA)的高可用性,可帮助您管理从故障 Compute 节点清空实例的过程。但是,该服务需要您的超级部门,并且当需要采取行动时。

  • Instance HA 服务会忽略您有意禁用的任何 Compute 节点。您可以按照以下原因,特意禁用 Compute 节点:

    • 您可以有意禁用健康的 Compute 节点,以确保有足够的容量来撤离失败的 Compute 节点的实例。如需更多信息,请参阅 保留健康的 Compute 节点
    • 您可以有意禁用必须维护或配置的 Compute 节点,因为 Compute 节点重新引导或关闭时不会通知 Instance HA 服务。如需更多信息 ,请参阅禁用 Compute 节点的撤离
  • 您可以通过将 DISABLED Instance HA 服务参数设置为 true 来防止 Instance HA 服务撤离失败的 Compute 节点。在这个模式中,Instance HA 服务监控您的计算节点,并记录有失败但不再做任何操作。如需更多信息,请参阅 编辑 Instance HA 服务参数
  • 您可以通过将 LEAVE_DISABLED Instance HA 服务参数设置为 true 来防止 Instance HA 服务重新启用失败的 Compute 节点,因为故障可能会指示有故障的硬件,而您不希望 Compute 节点再次失败。
  • 您可以查看 Instance HA 服务生成的日志文件,以对此进程进行故障排除。如需更多信息,请参阅对 Instance HA 服务进行故障排除
  • 当 Compute 节点的撤离缓慢或失败时,您可以手动将 Forced Down 标志设置为 false。如需更多信息,请参阅 Rehabilitating evacuated Compute nodes

3.1. 禁用 Compute 节点的撤离

当 Compute 节点被重启或关闭时,不会通知 Red Hat OpenStack Services on OpenShift (RHOSO) for Compute 实例(Instance HA)服务。因此,您必须禁用维护或配置的 Compute 节点的撤离。

流程

  • 如果您计划配置或维护有限数量的 Compute 节点,您可以单独禁用每个 Compute 节点。例如,您可以使用以下命令禁用名为 compute-7 的 Compute 节点进行维护:

    $ openstack compute service set --disable --disable-reason "maintenance" compute-7 nova-compute
    注意

    您可以使用 optional --disable-reason 参数指定禁用 Compute 节点的原因。不要使用在您的描述 中保留的 单词,因为 Instance HA 服务使用这个词语来识别有意禁用的健康 Compute 节点,以便为撤离实例提供保留容量。如需更多信息,请参阅 保留健康的 Compute 节点

  • 如果您计划配置或维护大量 Compute 节点,您可以通过将 DISABLED Instance HA 服务参数设置为 true 来临时禁用 Instance HA 服务。如需更多信息,请参阅 编辑 Instance HA 服务参数
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2026 Red Hat
返回顶部