1.2. 已知的可能会阻止更新的问题
查看以下可能影响到成功次版本更新的已知问题。
- Red Hat Ceph Storage 3 的次要更新可能会导致 OSD 崩溃
Red Hat Ceph Storage 3 依赖于 docker 来进行在 EL7 上运行的容器化部署。BZ-10-0-830 的 ceph-ansible 修复更新控制 Ceph 容器的 systemd 单元,使 systemd 单元需要启动和运行 docker 服务来执行。这个要求是实施安全更新路径,并避免在 docker 软件包不受控制的更新时服务中断甚至数据损坏。
更新 ceph-ansible 软件包不足以使 ceph-ansible 修复有效。您还必须通过重新运行部署 playbook 来更新容器的 systemd 单元。有关解决 director 驱动的 Ceph Storage 部署中的问题的信息,请参阅红帽知识库解决方案 问题影响 Red Hat Had Ceph Storage 3 的次要更新可能会导致 OSD 崩溃。
- OSP13 更新可能会在最终成功时显示失败
openstack overcloud update run
命令中使用的 pythontripleo-client
可能会在更新过程完成前超时。这会导致openstack overcloud update run
命令返回失败,更新过程会继续在后台运行,直到完成为止。要避免此失败,请编辑
tripleo-client/plugin.py
文件中的ttl
参数的值,以便在更新 overcloud 节点前增加tripleo-client
超时值。如需更多信息,请参阅红帽知识库解决方案 OSP 13 更新过程在更新过程在后台运行并成功完成时会出现失败。- 在 rabbitmq 连接中,slight cut 在完全同步后触发数据平面丢失
- 如果要从 RHOSP 13 z10 之前的版本(2019 年 12 月 19 日)更新您的环境,以避免在 bug BZ remove5538 中描述的数据平面连接丢失,请参阅 OSP13 上的红帽知识库解决方案 Stale 命名空间可以在更新过程中创建数据平面 丢失。
- 在 ceph 升级所有 OSD (及其他 ceph 服务)的过程中,
如果您使用 Ceph,请参阅红帽知识库解决方案,在 OSP13/RHCS3 的次要更新期间,到最新的软件包 Ceph 服务离线,需要手动重启, 以便在完成以下步骤前手动重启 以避免 bug BZ -2021-20842:
- 更新所有 Controller 节点
- 更新所有 HCI Compute 节点
- 更新所有 Ceph Storage 节点
- Octavia 和 LB 在 z11 升级后的问题
-
在更新过程中,因为缺少名为
/var/lib/config-data/puppet-generated/octavia/etc/octavia/conf.d/common/post-deploy.conf
的文件,所以负载均衡服务(Octavia)容器将持续重启。此文件是在 Red Hat OpenStack Platform 13 生命周期中引入的,以便在 Amphora 部署后配置 octavia 服务。此文件目前会在更新的openstack overcloud update converge
步骤中生成。要临时解决这个问题,您必须继续更新。在运行openstack overcloud update converge
命令后,octavia 容器会正常启动。Red Hat OpenStack Platform 工程团队目前正在调查这个问题的解决方法。 - DBAPIError exception wrap from (pymysql.err.InternalError) (1054, u"Unknown column 'pool.tls_certificate_id' in 'field list'"
如果您使用负载均衡服务(octavia),并希望从 RHOSP 13 z13 之前的版本更新(8 2020 年 10 月 8 日)以避免 bug BZheketi169,您必须以正确顺序运行升级负载均衡服务的数据库迁移。您必须更新 bootstrap Controller 节点,然后才能更新 control plane 的其余部分。
要识别您当前的维护发行版本,请运行以下命令:
$ cat /etc/rhosp-release
在 undercloud 节点上,要识别 bootstrap Controller 节点,请运行以下命令,并将 <
;any_controller_node_IP_address
> 替换为部署中任何 Controller 节点的 IP 地址:$ ssh heat-admin@<any_controller_node_IP_address> sudo hiera -c /etc/puppet/hiera.yaml octavia_api_short_bootstrap_node_name
在 undercloud 节点上,运行
openstack overcloud update run
命令来更新 bootstrap Controller 节点:$ openstack overcloud update run --nodes <bootstrap_node_name>
- 到 13z16 的次版本更新失败,并显示 "Unable to find constraint"
当您重启 Red Hat OpenStack Platform 13z16 overcloud 节点的更新时,您可能会遇到
Unable to find constraint
错误。发生此错误的原因是 RabbitMQ 版本在更新过程中存在差异。为确保新的 RabbitMQ 版本可以启动,您必须清除 overcloud 中可能存在的任何 pacemaker bans。有关此问题的更多信息,请参阅红帽知识库解决方案 无法重启 OSP13z16 控制器。
- 无法在控制器上停止 ceph-monmon controller: No such container: ceph-mon controller-2
如果您使用 Red Hat Ceph Storage 版本 3.3 z5 或更早版本,并将 docker 软件包更新至 docker-1.13.1-209,RHOSP 13 更新会失败。RHOSP 13 更新不会在 docker 软件包更新前停止 ceph-mon 容器。这会造成一个孤立的 ceph-mon 进程,该进程会阻止新的 ceph-mon 容器启动。
有关此问题的更多信息,请参阅红帽知识库解决方案 更新 Red Hat OpenStack Platform 13.z12 及更早版本,在控制器更新过程中可能会失败。