3.4. undercloud 和 overcloud 启动顺序
要启动 Red Hat OpenStack Platform 环境,您必须按照以下顺序启动 undercloud 和 overcloud:
- 启动 undercloud。
- 启动 Controller 节点。
- 启动 Ceph Storage 节点。
- 启动 Compute 节点。
- 启动 overcloud Compute 节点上的实例。
3.4.1. 启动 undercloud 复制链接链接已复制到粘贴板!
作为启动 Red Hat OpenStack Platform 环境的一部分,启动 undercloud 节点,登录到 undercloud,再检查 undercloud 服务。
先决条件
- undercloud 已关机。
流程
- 打开 undercloud 并等待 undercloud 引导。
验证
-
以
stack用户身份登录 undercloud 主机。 查找
stackrcundercloud 凭证文件:source ~/stackrc
$ source ~/stackrcCopy to Clipboard Copied! Toggle word wrap Toggle overflow 检查 undercloud 上的服务:
systemctl list-units 'tripleo_*'
$ systemctl list-units 'tripleo_*'Copy to Clipboard Copied! Toggle word wrap Toggle overflow 验证名为
tripleo-ansible-inventory.yaml的静态清单文件:validation run --group pre-introspection -i <inventory_file>
$ validation run --group pre-introspection -i <inventory_file>Copy to Clipboard Copied! Toggle word wrap Toggle overflow 将
<inventory_file> 替换为 Ansible 清单文件的名称和位置,如~/tripleo-deploy/undercloud/tripleo-ansible-inventory.yaml。注意当您运行验证时,输出中的
Reasons列仅限于 79 个字符。要查看验证结果已满,请查看验证日志文件。
检查所有服务和容器是否都活跃且健康:
validation run --validation service-status --limit undercloud -i <inventory_file>
$ validation run --validation service-status --limit undercloud -i <inventory_file>Copy to Clipboard Copied! Toggle word wrap Toggle overflow
3.4.2. 启动 Controller 节点 复制链接链接已复制到粘贴板!
作为启动 Red Hat OpenStack Platform 环境的一部分,打开每个 Controller 节点电源,并检查节点上的非 Pacemaker 服务。
先决条件
- Controller 节点已关机。
流程
- 打开每个 Controller 节点电源。
验证
-
以
root用户身份登录每个 Controller 节点。 检查 Controller 节点上的服务:
systemctl -t service
$ systemctl -t serviceCopy to Clipboard Copied! Toggle word wrap Toggle overflow 只有基于非 Pacemaker 的服务正在运行。
等待 Pacemaker 服务启动并检查服务是否已启动:
pcs status
$ pcs statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow 注意如果您的环境使用 Instance HA,Pacemaker 资源在启动 Compute 节点之前不会启动,或使用
pcs stonith confirm <compute_node>命令手动取消fence 操作。您必须在使用 Instance HA 的每个 Compute 节点上运行此命令。
3.4.3. 启动 Ceph Storage 节点 复制链接链接已复制到粘贴板!
作为启动 Red Hat OpenStack Platform 环境的一部分,打开 Ceph MON 和 Ceph Storage 节点电源,并启用 Ceph Storage 服务。
先决条件
- 已关闭电源的 Ceph Storage 集群
- Ceph MON 服务在已关闭电源的单机 Ceph MON 节点或已打开电源的 Controller 节点上启用
步骤
- 如果您的环境有单机 Ceph MON 节点,请打开每个 Ceph MON 节点电源。
- 打开每个 Ceph Storage 节点电源。
-
以
root用户身份登录运行 Ceph MON 服务的节点,如 Controller 节点或单机 Ceph MON 节点。 检查集群节点的状态:在以下示例中,
podman命令在 Controller 节点上的 Ceph MON 容器中运行状态检查:sudo podman exec -it ceph-mon-controller-0 ceph status
# sudo podman exec -it ceph-mon-controller-0 ceph statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow 确保每个节点都已打开电源并连接。
为集群取消设置
noout、norecover、norebalance、nobackfill、nodown和pause标志。在以下示例中,podman命令通过 Controller 节点上的 Ceph MON 容器取消设置这些标志:Copy to Clipboard Copied! Toggle word wrap Toggle overflow
验证
检查集群的运行状况。在以下示例中,
podman命令在 Controller 节点上的 Ceph MON 容器中运行状态检查:sudo podman exec -it ceph-mon-controller-0 ceph status
# sudo podman exec -it ceph-mon-controller-0 ceph statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow 确保状态为
HEALTH_OK。
3.4.4. 启动 Compute 节点 复制链接链接已复制到粘贴板!
作为启动 Red Hat OpenStack Platform 环境的一部分,打开每个 Compute 节点电源并检查节点上的服务。
先决条件
- 关闭 Compute 节点电源
步骤
- 打开每个 Compute 节点电源。
验证
-
以
root用户身份登录每个 Compute。 检查 Compute 节点上的服务:
systemctl -t service
$ systemctl -t serviceCopy to Clipboard Copied! Toggle word wrap Toggle overflow
3.4.5. 启动 overcloud Compute 节点上的实例 HA 服务 复制链接链接已复制到粘贴板!
作为启动 Red Hat OpenStack Platform 环境的一部分,启动 Compute 节点上的所有实例 HA 服务。
前提条件
- 带有运行 Compute 节点的 overcloud
- Compute 节点上启用了实例 HA
流程
-
以
root用户身份登录运行 Pacemaker 的 overcloud 节点。 为 Compute 节点启用 STONITH 设备:
识别 Compute 节点 STONITH 设备:
pcs stonith status
# pcs stonith statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow 清除 Compute 节点的 STONITH 错误:
pcs stonith confirm <COMPUTE_NODE>
# pcs stonith confirm <COMPUTE_NODE>Copy to Clipboard Copied! Toggle word wrap Toggle overflow 这个命令将节点返回到干净的 STONITH 状态。
启用 Compute 节点 STONITH 设备:
pcs stonith enable <STONITH_DEVICE>
# pcs stonith enable <STONITH_DEVICE>Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 使用 STONITH 为每个 Compute 节点执行这些步骤。
在每个 Compute 节点上启用 Pacemaker 远程资源:
识别 Compute 节点上的 Pacemaker 远程资源:
pcs resource status
# pcs resource statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow 这些资源使用
ocf::pacemaker:remote代理,通常以 Compute 节点主机格式命名,如overcloud-novacomputeiha-0。启用每个 Pacemaker 远程资源。以下示例演示了如何为
overcloud-novacomputeiha-0启用资源:pcs resource enable overcloud-novacomputeiha-0
# pcs resource enable overcloud-novacomputeiha-0Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 使用 Pacemaker 远程管理为每个 Compute 节点执行这些步骤。
等待 Pacemaker 服务启动并检查服务是否已启动:
pcs status
# pcs statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow 如果任何 Pacemaker 资源在引导过程中启动,请重置资源状态和资源失败计数:
pcs resource cleanup
# pcs resource cleanupCopy to Clipboard Copied! Toggle word wrap Toggle overflow 注意有些服务可能需要更多时间才能启动,如
fence_compute和fence_kdump。
3.4.6. 启动 overcloud Compute 节点上的实例 复制链接链接已复制到粘贴板!
作为启动 Red Hat OpenStack Platform 环境的一部分,启动 Compute 节点上的实例。
先决条件
- 具有活跃节点的活跃 overcloud
步骤
-
以
stack用户身份登录 undercloud。 提供 overcloud 的凭据文件:
source ~/overcloudrc
$ source ~/overcloudrcCopy to Clipboard Copied! Toggle word wrap Toggle overflow 查看 overcloud 中运行的实例:
openstack server list --all-projects
$ openstack server list --all-projectsCopy to Clipboard Copied! Toggle word wrap Toggle overflow 启动 overcloud 中的实例:
openstack server start <INSTANCE>
$ openstack server start <INSTANCE>Copy to Clipboard Copied! Toggle word wrap Toggle overflow