17.8. Controller 节点替换后清理
完成节点替换后,执行以下步骤来完善 Controller 集群。
步骤
- 登录 Controller 节点。
启用 Galera 集群的 Pacemaker 管理,并在新节点上启动 Galera:
[heat-admin@overcloud-controller-0 ~]$ sudo pcs resource refresh galera-bundle [heat-admin@overcloud-controller-0 ~]$ sudo pcs resource manage galera-bundle执行最后的状态检查来确保服务在正确运行:
[heat-admin@overcloud-controller-0 ~]$ sudo pcs status注意如果有任何服务失败,请使用
pcs resource refresh命令来解决问题并重新启动失败的服务。退出 director:
[heat-admin@overcloud-controller-0 ~]$ exit查找
overcloudrc文件,以便您可以跟 overcloud 交互:$ source ~/overcloudrc检查 overcloud 环境中的网络代理:
(overcloud) $ openstack network agent list如果出现任何旧节点的代理,请删除它们:
(overcloud) $ for AGENT in $(openstack network agent list --host overcloud-controller-1.localdomain -c ID -f value) ; do openstack network agent delete $AGENT ; done如有必要,将您的路由器添加到新节点上的 3 层代理主机。使用以下示例命令,通过 UUID 2d1c1dc1-d9d4-4fa9-b2c8-f29cd1a649d4 将名为
r1的路由器添加到 L3 代理中:(overcloud) $ openstack network agent add router --l3 2d1c1dc1-d9d4-4fa9-b2c8-f29cd1a649d4 r1清理 cinder 服务。
列出 cinder 服务:
(overcloud) $ openstack volume service list登录到控制器节点,连接到
cinder-api容器,并使用cinder-manage service remove命令删除左侧服务:[heat-admin@overcloud-controller-0 ~]$ sudo podman exec -it cinder_api cinder-manage service remove cinder-backup <host> [heat-admin@overcloud-controller-0 ~]$ sudo podman exec -it cinder_api cinder-manage service remove cinder-scheduler <host>
清理 RabbitMQ 集群。
- 登录 Controller 节点。
使用
podman exec命令启动 bash,并验证 RabbitMQ 集群的状态:[heat-admin@overcloud-controller-0 ~]$ podman exec -it rabbitmq-bundle-podman-0 bash [heat-admin@overcloud-controller-0 ~]$ rabbitmqctl cluster_status使用
rabbitmqctl命令忘记替换的控制器节点:[heat-admin@overcloud-controller-0 ~]$ rabbitmqctl forget_cluster_node <node_name>
-
如果替换了 bootstrap Controller 节点,则必须在替换过程后移除环境文件
~/templates/bootstrap-controller.yaml,或者从现有环境文件中移除pacemaker_short_bootstrap_node_name和mysql_short_bootstrap_node_name参数。此步骤可防止 director 在后续替换中尝试覆盖 Controller 节点名称。如需更多信息,请参阅 替换 bootstrap 控制器节点。