3.2. Red Hat OpenStack Platform 17.1.3 维护发行版本 - 2024 年 5 月 22 日
部署此 RHOSP 发行版本时,请考虑 Red Hat OpenStack Platform (RHOSP)中的以下更新。
3.2.1. 公告列表
此 Red Hat OpenStack Platform (RHOSP)发行版本包括以下公告:
- RHSA-2024:2727
- 重要: Red Hat OpenStack Platform 17.1 (python-gunicorn)安全更新
- RHSA-2024:2729
- 重要: Red Hat OpenStack Platform 17.1 (etcd)安全更新
- RHSA-2024:2730
- 重要: Red Hat OpenStack Platform 17.1 (collectd-sensubility)安全更新
- RHSA-2024:2731
- 中等:Red Hat OpenStack Platform 17.1 (python-django)安全更新
- RHSA-2024:2732
- 中等:Red Hat OpenStack Platform 17.1 (python-glance-store)安全更新
- RHSA-2024:2733
- 中等:Red Hat OpenStack Platform 17.1 (openstack-ansible-core)安全更新
- RHSA-2024:2734
- 中等:Red Hat OpenStack Platform 17.1 (python-urllib3)安全更新
- RHSA-2024:2735
- 中等:Red Hat OpenStack Platform 17.1 (python-paramiko)安全更新
- RHSA-2024:2736
- 中等:Red Hat OpenStack Platform 17.1 (openstack-tripleo-heat-templates 和 tripleo-ansible)安全更新
- RHSA-2024:2737
- 中等:Red Hat OpenStack Platform 17.1 (python-openstackclient)安全更新
- RHBA-2024:2738
- 更新了 Red Hat OpenStack Platform 17.1 容器镜像
- RHBA-2024:2739
- 更新了 Red Hat OpenStack Platform 17.1 容器镜像
- RHBA-2024:2740
- Red Hat OpenStack Platform 17.1 RHEL 9 director 镜像
- RHBA-2024:2741
- Red Hat OpenStack Platform 17.1 程序错误修复和安全更新
- RHBA-2024:2742
- Red Hat OpenStack Platform 17.1 程序错误修复和安全更新
- RHSA-2024:2767
- 重要: Red Hat OpenStack Platform 17.1 (collectd-sensubility)安全更新
- RHSA-2024:2768
- 中等:Red Hat OpenStack Platform 17.1 (python-paramiko)安全更新
- RHSA-2024:2769
- 中等:Red Hat OpenStack Platform 17.1 (python-openstackclient)安全更新
- RHSA-2024:2770
- 中等:Red Hat OpenStack Platform 17.1 (tripleo-ansible 和 openstack-tripleo-heat-templates)安全更新
3.2.2. 程序错误修复
此 Red Hat OpenStack Platform (RHOSP)发行版本中解决了这些程序错误:
- BZ#2222683
在这个版本中,红帽对 Multi-RHEL 的支持被扩展,使其包含以下部署架构:
- Edge (DCN)
- ShiftOnStack
- 基于 director Operator 的部署
- BZ#2229779
- 在这个版本中,当子进程无法启动时,OVN 元数据代理进程异常处理。在这个版本中,子进程异常会被记录,主 OVN 元数据代理继续运行。
- BZ#2237866
-
在此次更新之前,不支持为 ceilometer 配置缓存参数。有了这个更新,对于缓存,ceilometer 使用
dogpile.cache.memcached
后端。如果您手动禁用缓存,ceilometer 将使用oslo_cache.dict
后端。 - BZ#2248873
-
对于某些可插拔验证模块(PAM)版本,pam_loginuid 模块
/proc/self/loginuid
必须可写。这并非用于迁移的sshd
容器。迁移失败,因为 Compute 主机间的 SSH 登录失败。在这个版本中,pam_loginuid
模块已从 PAM 配置中删除,因此,计算主机和迁移之间的 SSH 登录可以再次工作。 - BZ#2249444
在此次更新之前,计算节点上与 libvirt 相关的容器需要在部署、更新和扩展操作过程中重启,即使容器配置没有改变。
在这个版本中,在部署、更新和扩展操作过程中不会重启没有配置更改的与 libvirt 相关的容器。
- BZ#2249690
在此次更新之前,在升级过程中每个成功使用 Red Hat Ceph Storage 后,
ceph-ansible
软件包会被默认删除。在这个版本中,为移除
ceph-ansible
的任务引入了标签cleanup_cephansible
。在运行采用 playbook 时,您可以将此标签与--skip-tags
搭配使用,以避免删除。- BZ#2254036
在此次更新之前,在带有多个堆栈的设置上的 DCN FFU 系统升级节点时,Red Hat Ceph Storage 任务
Set noout 标志
可能无法在正确的主机上运行 ceph 命令。更新后,多堆栈设置中的任何节点上的系统升级现在将 Red Hat Ceph Storage 任务
Set noout 标志
分配给相关主机,ceph
命令在特定集群中运行。- BZ#2254994
在这个版本中,存在一个程序错误,这会导致意外删除负载均衡服务(octavia)健康监控端口和 OVN 元数据端口。
在此次更新之前,在使用之前版本的负载均衡服务运行状况监控端口的 RHOSP 环境中,运行
neutron-db-sync-tool
有时随机删除这些预先存在的端口或 OVN 元数据端口。这种意外的端口删除会导致健康监控容量丢失,或与受影响的实例通信丢失。这个版本解决了冲突。它使用新值
ovn-lb-hm:distributed
,用于 OVN Load-balancing 服务运行状况监控端口device_owner
字段。旧的 OVN 负载均衡服务运行状况监控端口会根据此版本自动更新。- BZ#2255324
在此次更新之前,director 程序错误可能会在更新或升级到任何 RHOSP 17.1 版本过程中中断或崩溃客户端工作负载。这个错误会影响在 NFS 后端上启用了 CephFS 的 RHOSP 共享文件系统服务(manila)的部署。
在这个版本中,解决了这个问题,当用户在共享上设置"访问规则"时,共享文件系统服务(manila)可以正常工作。
- BZ#2257274
-
在此次更新之前,当将巨型帧用于网络服务(neutron)租户网络时,RHOSP Controller 关闭有时会导致 RHOSP 负载均衡服务(octavia)管理接口(
o-hm0
)将其 MTU 重置为一个小值,如 1500 或 1450。当 RHOSP Controller 首次重启时,或者控制器被突然终止时,通常会出现这个问题。在这个版本中,RHOSP director 确保在创建o-hm0
时,使用正确的 MTU 配置 Open vSwitch (OVS)。 - BZ#2259286
在此次更新之前,当记录的升级过程没有遵循用户时,FFU 过程有时会使用不正确的 Red Hat Ceph Storage 镜像。
在这个版本中,FFU 过程总是使用正确的 Red Hat Ceph Storage 镜像。
multi-rhel-container-image-prepare.py
脚本已更新,以使用正确的默认值和版本验证检查,已将 FFU 进程添加到 FFU 进程。- BZ#2263552
在这个版本中,存在一个程序错误,它会阻止在 ML2/OVN 环境中的 IPv6 网络上的一些负载均衡服务(octavia)池成员进行负载均衡。
在此次更新之前,如果您向池添加了第二个
监听程序+pool+member
,池会进入 ERROR 状态,且池中的流量没有负载均衡。在这个版本中,流量会如预期对所有成员进行负载均衡。
- BZ#2263916
在这个版本中,防止从 RHOSP 16.2 升级到 RHOSP 17.1,使用 libvirt 配置可能会导致升级后工作负载中断。
在此次更新之前,如果您从 RHOSP 16.2 环境(包括 Red Hat Enterprise Linux (RHEL) 8 上的模块部署)或在 RHEL 8 上运行 libvirt UBI9,则这些配置有时会导致工作负载中断。
在这个版本中,如果 RHOSP 16.2 环境在 Red Hat Enterprise Linux (RHEL) 8 上包括 libvirt 的模块化部署,或者在 RHEL 8 上运行 libvirt UBI9,则从 RHOSP 16.2 升级到 17.1 会失败。
- BZ#2266285
在这个版本中,存在一个程序错误,阻止在 ML2/OVN 部署的 IPv6 网络中对负载均衡服务(octavia)操作 OVN Health Monitoring。
在以前的版本中,OVN Health Monitor 服务无法正确识别后端成员的
ONLINE
和OFFLINE
状态。在这个版本中,负载均衡可以正常工作,OVN Health Monitor 会正确识别后端成员的
ONLINE
和OFFLINE
状态。- BZ#2278028
在此次更新之前,在升级到 RHOSP 17.1 以及在使用 ML2/OVN 机制驱动程序的次版本间更新时,使用 ML2/OVN 机制驱动程序会在一段时间内停止从 OVN 数据库接收更新。当包含 RAFT 领导的 Controller 节点被更新时,机制驱动程序也会从 OVN 数据库接收更新。
有了此更新,这个问题已被解决。现在,在 RHOSP 更新和升级过程中,使用 ML2/OVN 机制驱动程序的网络服务可以正常工作。
3.2.3. 功能增强
此 Red Hat OpenStack Platform (RHOSP)发行版本包括以下改进:
- BZ#1900663
- 在这个版本中,红帽对升级的框架的支持被扩展为包括 DCN 部署,而无需在边缘存储。
- BZ#1997638
- 在这个版本中,红帽对升级的框架的支持被扩展为包括具有边缘存储的 DCN 部署。
- BZ#2218000
- 在这个版本中,您可以使用 Bare Metal 服务(ironic)来直接引导 ISO 镜像,以用作 RAM 磁盘。如需更多信息,请参阅为裸机实例启用 ISO 引导,并直接引导 ISO 镜像以用作 RAM 磁盘。
- BZ#2224492
RHOSP 17.1.3 现在支持通过 Open Virtual Network (OVN)版本 23.09 中包含的
localnet_learn_fdb
选项了解的 MAC 地址的新老机制。这个新的老化机制由两个新选项fdb_age_thhreshold
和fdb_removal_limit
组成。fdb_age_thhreshold
选项允许您设置所了解的 MAC 在 FDB 表(以秒为单位)中的最大时间。fdb_removal_limit
选项可防止 OVN 一次性删除大量 FDB 表条目。当您将这些新选项与
localnet_learn_fdb
一起使用时,您可以降低 FDB 表增长太大的 RHOSP 环境中通常遇到的问题的可能性。- BZ#2225163
- 在 Red Hat Enterprise Linux 9 (RHEL 9)中引入了节能配置集 cpu-partitioning-powersave,现在在 Red Hat OpenStack Platform (RHOSP) 17.1.3 中提供。此 TuneD 配置集是在 RHOSP 17.1 NFV 环境中节省电源的基本构建块。有关更多信息,请参阅配置 网络功能虚拟化 中的 OVS-DPDK 部署中的节省电源。
- BZ#2255168
-
在这个版本中,您可以在特定的可用区中添加负载均衡功能。在
OS::Octavia::LoadBalancer
资源中,使用新的availability_zone
属性指定负载均衡器的可用区。 - BZ#2255373
- 此增强更新了 Dell PowerFlex 存储的 Block Storage (cinder)驱动程序,以支持 Dell PowerFlex 软件版本 4.5。
- BZ#2261924
- 在这个版本中,RHOSP 17.1 支持 RHCS 7 作为外部 Red Hat Ceph Storage 集群。
- BZ#2262266
- 共享文件系统服务(manila)现在包含在 Dell PowerFlex 存储系统上置备和管理 NFS 共享的后端驱动程序。当供应商发布生态系统目录上的认证时,支持使用此驱动程序。
- BZ#2262313
- 共享文件系统服务(manila)现在包含一个后端驱动程序,用于在 Dell PowerStore 存储系统上配置和管理 NFS 和 CIFS 共享。当供应商发布生态系统目录上的认证时,支持使用此驱动程序。
- BZ#2264273
- 此增强更新了 Hewlett Packard Enterprise (HPE) 3PAR 产品系列的块存储(cinder)驱动程序,以支持 Alletra MP Storage 数组。
3.2.4. 技术预览
您可以在 Red Hat OpenStack Platform (RHOSP)的这个版本中测试以下技术预览功能。这些功能为您提供对即将推出的产品功能的早期访问,以便您在开发过程中测试并提供反馈。您的红帽订阅不支持这些功能,红帽不推荐在生产环境中使用它们。有关技术预览功能支持范围的更多信息,请参阅 https://access.redhat.com/support/offerings/techpreview/。
- BZ#2217663
在 RHOSP 17.1 中,VF-LAG 传输哈希策略卸载提供了一个技术预览,它允许在 NIC 硬件上进行负载均衡以卸载流量/流。这个哈希策略仅适用于 layer3+4 基础散列。
要使用技术预览,请验证您的模板是否包含绑定选项参数来启用 xmit 哈希策略,如下例所示:
bonding_options: "mode=802.3ad miimon=100 lacp_rate=fast xmit_hash_policy=layer3+4"
3.2.5. 已知问题
目前,Red Hat OpenStack Platform (RHOSP)中存在这些已知问题:
- BZ#2163477
目前,在使用 BGP 动态路由的 RHOSP 17.1 环境中,RHOSP 计算服务无法将数据包从其中一个实例路由到多播 IP 地址目的地。因此,订阅多播组的实例无法接收发送到它们的数据包。其原因是 overcloud 节点上没有正确配置 BGP 多播路由。
临时解决方案: 目前,没有临时解决方案。
- BZ#2187985
添加其子网不在负载均衡服务(octavia)可用区中的负载均衡器成员会将负载均衡器置于
ERROR
。由于ERROR
状态而无法删除成员,使负载均衡器不可用。临时解决方案: 删除负载均衡器。
- BZ#2192913
在启用了 DVR 的 ML2/OVN 或 ML2/OVS 的 RHOSP 环境中,连接到不同租户网络的实例之间的 east/west 流量会产生大量到光纤。
因此,这些实例之间的数据包不仅到达运行这些实例的 Compute 节点,还到达任何其他 overcloud 节点。
这可能会影响网络,这可能是安全风险,因为光纤在任何位置发送流量。
这个错误将在 FDP 以后的发行版本中解决。您不需要执行 RHOSP 更新来获取 FDP 修复。
- BZ#2210319
目前,RHEL 9.2 中的 Retbleed 漏洞缓解可能会导致 Intel Skylake CPU 上使用 Data Plane Development Kit (OVS-DPDK)的 Open vSwitch 的性能下降。
只有在 BIOS 中禁用了 C-states,Hy-Threading Technology 被启用,OVS-DPDK 只使用一个给定内核的逻辑核心时才会发生此性能回归。
临时解决方案: 将逻辑内核分配给 OVS-DPDK 或具有 DPDK 的 SR-IOV 客户机,如 配置网络功能虚拟化 中所述。
- BZ#2216021
带有 OVN 机制驱动程序的 RHOSP 17.1 不支持记录每个端口的流事件,或使用
网络日志 create
命令的--target
选项。RHOSP 17.1 支持使用
network log create
命令的--resource
选项为每个安全组记录流事件。如需更多信息,请参阅配置 Red Hat OpenStack Platform 网络 中的日志记录 安全组操作。- BZ#2217867
- 在使用硬件卸载时,在 Nvidia ConnectX-5 和 ConnectX-6 NIC 上,一些卸载流在 PF 上可能会导致关联 VF 上的临时性能问题。此问题通过 LLDP 和 VRRP 流量特别观察到。
- BZ#2220887
- 数据收集服务(ceilometer)报告错误的单元以获取当前电源。当前在 Watts 之外的 Ampere 中测量。
- BZ#2234902
-
验证
check-kernel-version
无法正常工作,并报告失败。您可以忽略失败。 - BZ#2237290
网络服务(neutron)不会阻止您禁用或删除网络配置文件,即使该配置集是路由器正在使用的类别的一部分。禁用或删除配置集可能会破坏路由器的正确操作。
临时解决方案: 在禁用或删除网络配置集前,请确保它不是路由器当前使用的类别的一部分。
- BZ#2241270
-
frr-status
和oslo-config-validator
验证在更新过程中报告 FAILED。您可以忽略这些错误消息。它们特定于验证代码,不指明任何影响 17.1 操作的条件。以后的发行版本中将修复它们。 - BZ#2241326
-
LDAP 服务器连接会如预期从
TIMEOUT
或SERVER_DOWN
错误上的 Keystone LDAP 池中删除。LDAP 池耗尽其连接,且无法重新建立新的连接。已发出MaxConnectionReachedError
。临时解决方案: 禁用LDAP 池
。 - BZ#2243267
-
存在 Virtual Data Optimizer (VDO)软件包会导致
checkvdo
Leapp actor 失败。因此,Leapp 升级会失败。要成功完成 Leapp 升级,请删除 VDO 软件包。 - BZ#2251176
Ceph 控制面板无法访问 Prometheus 服务端点,并显示以下出错信息: 404 not found。发生此错误的原因是为 Prometheus 服务配置 VIP 不正确。
临时解决方案:
-
验证 haproxy 是否已正确配置:ssh 到控制器节点(如 controller-0),并运行
curl http://10.143.0.25:9092
。如果 curl 成功,则配置是正确的。 如果
curl
成功,ssh 到控制器节点,并更新 ceph 集群中的 prometheus API 配置:$ sudo cephadm shell -- ceph dashboard set-prometheus-api-host http://10.143.0.25:9092
要验证 Ceph 控制面板是否可以访问 Prometheus 服务端点,并且不再显示 404 not found 错误消息,请检查 Ceph Dashboard UI。
-
验证 haproxy 是否已正确配置:ssh 到控制器节点(如 controller-0),并运行
- BZ#2254553
-
目前,在 Red Hat Ceph Storage 6 中,当提供了有效网络列表时,
cephadm
会尝试将 Grafana 守护进程绑定到所有接口。这可防止 Grafana 守护进程启动。 - BZ#2255302
如果您的部署有多个文件系统的外部 Ceph 集群,则无法按预期创建共享文件系统服务(Manila)共享。
cephfs_filesystem_name
驱动程序配置参数需要避免这种情形,无法使用 director 的 heat 模板参数设置。临时解决方案 :设置 "cephfs_filesystem_name" 参数,以指定共享文件系统服务(Manila)必须通过 "ExtraConfig" 使用的文件系统。
在环境文件中添加参数,如下例所示:
$ cat /home/stack/manila_cephfs_customization.yaml parameter_defaults: ExtraConfig: manila::config::manila_config: cephfs/cephfs_filesystem_name: value: <filesystem>
将 <filesystem> 值替换为适当的名称,并将此环境文件替换为
openstack overcloud deploy
命令。- BZ#2257419
为
libvirt
管理的方式在 RHEL 版本之间有所变化。因此,virsh cpu-stats
不是 Red Hat OpenStack Platform (RHOSP)产品的官方支持部分。这个功能由从 RHEL 接收的libvirt
的底层版本提供。Greenfield RHOSP 17.x 仅在 RHEL 9 上支持,它使用 cgroup v2。cgroup v2 API 不提供支持virsh cpu-stats
API 所需的 API,此功能在 RHEL 9 上使用 17.1 时不可用。RHOSP 17.1 on RHEL 8 在来自 16.2 的混合 RHEL 升级过程中被支持,以便在 rhel 8.4 上运行时进行 virsh cpu-stats 功能。因此,virsh cpu-stats 功能已在 RHEL 8 主机上恢复,但在完全升级的 RHEL 9 主机上不可用。
- BZ#2259873
当使用 Lenovo SR650 服务器将 RHOSP 16.2 升级到 17.1 时,服务器在第一次引导时会失败,显示蓝色屏幕,表示缺少有效的引导设备。
此问题是由部署后 Lenovo UEFI 固件重置引导记录造成的。RHOSP director 请求对 UEFI 固件设置进行两个更改。但是,Lnovo 硬件只能在重启前处理一个请求。
临时解决方案 :您必须手动将 Lenovo 服务器重启到所需的操作系统。
- BZ#2266778
-
在使用 RHOSP DNS 服务(指定)的 RHOSP 17.1 环境中,涉及 TSIG 密钥的区域传输可能会失败。日志消息为:
AttributeError: 'TsigKeyring' 对象没有属性 'name'
。此问题是由python3-dns
软件包版本 2.x 引入与 RHOSP DNS 服务不兼容造成的。这个问题已被解决,并将在以后的维护版本中可用。临时解决方案: 目前,没有临时解决方案。 - BZ#2267882
- 存在一个已知问题:使用 RHOSP Dashboard (horizon)列出区中的记录仅返回 20 个结果,即使区包含超过 20 个记录。RHOSP DNS 服务(designate)仪表板在仪表板中无法正确支持分页。这个问题已被解决,并将在以后的 RHOSP 维护发行版本中可用。临时解决方案: 目前,临时解决方案是使用 RHOSP 命令行界面而不是 Dashboard。
- BZ#2274468
在使用动态路由以及带有 OVN 供应商驱动程序的 OpenStack 负载均衡服务(octavia)的 RHOSP 17.1 环境中,存在一个已知问题:删除负载平衡 VIP。删除是由同步 OVN BGP 代理和负载均衡服务的进程造成的。
临时解决方案: 临时解决方案是将协调间隔增加到非常高的值。创建自定义环境 YAML 文件并添加以下值:
parameter_defaults: FrrOvnBgpAgentReconcileInterval: 999999
如需更多信息,请参阅 4.11。部署启用了 spine-leaf 的 overcloud。
重要使用这个临时解决方案意味着 OVN 负载均衡 VIP 可以正常工作,但 OVN BGP 代理和 Free Range Routing (FRR)之间的同步有效。同步无法正常运行时,如果在 FRR 配置过程中出现问题,FRR 将不会恢复,直到通过了配置的时间间隔为止。
- BZ#2274663
在使用动态路由的 RHOSP 环境中,在次版本更新期间,自由范围路由(FRR)会在一行中重启两次。在以下情况下在更新过程中会出现这种情况:
- 从 RHOSP 17.1.0 到 17.1.2 或 17.1.3。
从 RHOSP 17.1.1 到 17.1.2 或 17.1.3。
发生第一次重启,因为存在新的容器镜像。第二个重启由对
tripleo_frr.service
systemd 文件的更改触发。这些不需要的重启是在程序错误修复中引入的,以解决 BZ 2237245 的问题。
临时解决方案 :执行以下步骤:
重要这个临时解决方案需要重启
tripleo_frr
服务,并可能导致网络停机。因此,在维护窗口内执行这些步骤。-
打开配置文件
/etc/systemd/system/tripleo_frr.service
。 在
ExecStopPost
的第一个实例后
,添加另一个包含以下值的 ExecStopPost 实例:ExecStopPost=/usr/bin/sleep 10
Example
[Unit] Description=frr container After=tripleo-container-shutdown.service [Service] Restart=always ExecStart=/usr/bin/podman start frr ExecReload=/usr/bin/podman kill --signal HUP frr ExecStop=/usr/bin/podman stop -t 42 frr ExecStopPost=/usr/bin/podman stop -t 42 frr ExecStopPost=/usr/bin/sleep 10 SuccessExitStatus=137 142 143 TimeoutStopSec=84 KillMode=control-group Type=forking PIDFile=/run/frr.pid [Install] WantedBy=multi-user.target …
重启
tripleo_frr
服务:# systemctl daemon-reload # systemctl restart tripleo_frr
-
打开配置文件
3.2.6. 过时的功能
本节中的项目可能不再被支持,或者在以后的 Red Hat OpenStack Platform (RHOSP)发行版本中不再支持:
- BZ#1946898
-
i440FX PC 计算机类型
pc-i440fx
在 RHEL 8 中已被弃用。虽然pc-i440fx
busybox 机器类型仍然可用,但红帽建议您在 RHOSP 17.1 中使用默认的 Q35 机器类型。有些 RHOSP 17.1 功能无法用于 i440FX PC 机器类型。例如,VirtIO 块(virtio-blk
)设备无法用于 RHOSP 17.1 中的 i440FX PC 机器类型。要将 VirtIO Block 用作 RHOSP 17.1 中的实例的块设备,您的实例必须使用 Q35 机器类型。