第 1 章 介绍和规划实例 HA 部署


Compute 实例的高可用性(Instance HA)是一种可用于从故障 Compute 节点撤离实例的工具,并在不同的 Compute 节点上重新创建实例。

实例 HA 使用共享存储或本地存储环境,这意味着撤离实例维护相同的网络配置,如静态 IP 地址和浮动 IP 地址。重新创建的实例还在新 Compute 节点中维护相同的特征。

1.1. 实例 HA 的工作原理

当 Compute 节点出现故障时,overcloud 隔离代理将隔离该节点,然后实例 HA 代理从故障 Compute 节点撤离到不同的 Compute 节点。

当 Compute 节点失败并触发 Instance HA 时,会出现以下事件:

  1. 在出现故障时,IPMI 代理执行第一层隔离,包括物理重置节点以确保其关闭并防止数据损坏或 overcloud 上的多个相同实例。当节点离线时,它被视为隔离。
  2. 物理 IPMI 隔离后,fence-nova 代理会自动执行第二层隔离功能,并通过运行以下命令,使用 "vacuate=yes" 集群标记隔离的节点:

    Copy to Clipboard Toggle word wrap
    $ attrd_updater -n evacuate -A name="evacuate" host="FAILEDHOST" value="yes"

    FAILEDHOST 是失败的 Compute 节点的名称。

  3. nova-evacuate 代理会持续在后台运行,并定期检查具有 "evacuate=yes" 属性的节点。当 nova-evacuate 检测到隔离的节点包含此属性时,代理开始撤离该节点。撤离过程与您可以在任何时候执行的手动实例撤离过程类似。
  4. 当故障节点在 IPMI 重置后重启时,该节点上的 nova-compute 进程也会自动启动。由于该节点之前已隔离,所以在 Pacemaker 取消隔离节点前不会运行任何新实例。
  5. 当 Pacemaker 检测到 Compute 节点在线时,它会在节点上启动 compute-unfence-trigger 资源代理,该代理会释放该节点,以便它能够再次运行实例。

其他资源

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat, Inc.