3.2. Red Hat OpenStack Platform 17.1.2 维护发行版本 - 2024 年 1 月 16 日
部署此 RHOSP 发行版本时,请考虑 Red Hat OpenStack Platform (RHOSP)中的以下更新。
3.2.1. 公告列表
此 Red Hat OpenStack Platform (RHOSP)发行版本包括以下公告:
- RHBA-2024:0185
- Red Hat OpenStack Platform 17.1.2 程序错误修复更新和功能增强公告
- RHBA-2024:0186
- 更新了 Red Hat OpenStack Platform 17.1.2 容器镜像
- RHSA-2024:0187
- 中等:Red Hat OpenStack Platform 17.1 (python-urllib3)安全更新
- RHSA-2024:0188
- 中等:Red Hat OpenStack Platform 17.1 (python-eventlet)安全更新
- RHSA-2024:0189
- 中度:Red Hat OpenStack Platform 17.1 (python-werkzeug)安全更新
- RHSA-2024:0190
- 中等:Red Hat OpenStack Platform 17.1 (GitPython)安全更新
- RHSA-2024:0191
- 中等:Red Hat OpenStack Platform 17.1 (openstack-tripleo-common)安全更新
- RHBA-2024:0209
- Red Hat OpenStack Platform 17.1.2 程序错误修复更新和功能增强公告
- RHBA-2024:0210
- 更新了 Red Hat OpenStack Platform 17.1.2 容器镜像
- RHBA-2024:0211
- Red Hat OpenStack Platform 17.1.2 RHEL 9 director 镜像
- RHSA-2024:0212
- 中等:Red Hat OpenStack Platform 17.1 (python-django)安全更新
- RHSA-2024:0213
- 中等:Red Hat OpenStack Platform 17.1 (python-eventlet)安全更新
- RHSA-2024:0214
- 中度:Red Hat OpenStack Platform 17.1 (python-werkzeug)安全更新
- RHSA-2024:0215
- 中等:Red Hat OpenStack Platform 17.1 (GitPython)安全更新
- RHSA-2024:0216
- 中等:Red Hat OpenStack Platform 17.1 (openstack-tripleo-common)安全更新
- RHSA-2024:0217
- 中等:Red Hat OpenStack Platform 17.1 (rabbitmq-server)安全更新
- RHSA-2024:0263
- 更新了 Red Hat OpenStack Platform 17.1.2 director Operator 容器镜像
3.2.2. 程序错误修复
此 Red Hat OpenStack Platform (RHOSP)发行版本中解决了这些程序错误:
- BZ#2108212
在这个版本中,解决了在从 OVS 机制驱动程序迁移到 OVN 机制驱动程序的过程中破坏了 IPv6 实例的连接。
现在,您可以在不中断实例的情况下从 OVS 迁移到带有 IPv6 的 OVN。
- BZ#2126725
- 在此次更新之前,硬编码的证书位置独立于用户提供的值进行操作。在带有自定义证书位置的部署期间,服务不会从 API 端点检索信息,因为传输层安全(TLS)验证失败。在这个版本中,用户提供的证书位置会在部署过程中使用。
- BZ#2151219
-
在此次更新之前,RHOSP director 不允许自动配置名称服务器(NS)记录以匹配父的 NS 记录。在 RHOSP 17.1.2 中,通过添加新的编排服务(heat)参数
DesignateBindNSRecords
来解决此问题。管理员可以使用此新参数为 DNS 服务(指定)填充的域定义根 NS 列表。如需更多信息,请参阅配置 DNS 作为服务。 - BZ#2167428
- 在此次更新之前,在新部署期间,身份服务(keystone)在初始化 agent-notification 服务过程中通常不可用。这导致数据收集服务(ceilometer)无法发现 gnocchi 端点。因此,指标不会发送到 gnocchi。在这个版本中,gnocchi 会在声明无法访问它之前多次尝试连接数据收集服务。
- BZ#2180542
在这个版本中解决了在重启所有 Controller 节点后导致
ceph-nfs
服务失败的问题。Pacemaker 控制的
ceph-nfs
资源需要一个运行时目录来存储某些进程数据。在此次更新之前,在安装或升级 RHOSP 时会创建该目录。但是,重启 Controller 节点会删除该目录,在 Controller 节点重启时不会恢复
ceph-nfs
服务。如果所有 Controller 节点都已重启,ceph-nfs
服务会永久失败。在这个版本中,会在生成
ceph-nfs
服务前创建该目录,cephfs-nfs
服务继续重启。- BZ#2180883
-
在这个版本中解决了导致
rsyslog
停止将日志发送到 Elasticsearch 的错误。 - BZ#2193388
- 在此次更新之前,将 Dashboard 服务(horizon)配置为默认验证客户端 TLS 证书,这会在所有 TLS 任何位置(TLS-e)部署中破坏 Dashboard 服务。在这个版本中,仪表板服务不再默认验证客户端 TLS 证书,仪表板服务可以正常工作。
- BZ#2196291
- 在这个版本中,存在一个阻止非管理员用户列出或管理策略规则的错误。现在,您可以允许非管理员用户列出或管理策略规则。
- BZ#2203785
在这个版本中解决了在重启一个裸机节点后导致 collectd sensubility 停止工作的权限问题。
现在,在重新引导裸机节点后,collectd sensubility 会继续运行。
- BZ#2213126
在这个版本中解决了这个问题,有时会导致安全组日志记录队列在到达
NeutronOVNLoggingRateLimit
中设置的限制前停止接受条目。您可以使用参数
NeutronOVNLoggingRateLimit
设置每秒的最大日志条目数。如果日志条目创建超过那个速率,则过量在队列中会被缓冲到您在NeutronOVNLoggingBurstLimit
中指定的日志条目数。在此次更新之前,在短的突发过程中,队列有时会在到达
NeutronOVNLoggingBurstLimit
中指定的限制前停止接受条目。在这个版本中,
NeutronOVNLoggingBurstLimit
值会如预期影响队列限制。- BZ#2213742
- 在这个版本中,存在一个阻止 UDP 池中 TCP 健康监控器运行的错误。在以前的版本中,池成员和运行状况监控器的状态不会被正确报告。这是因为 SELinux 规则破坏了 UDP 池中特定端口号上使用 TCP 运行状况监控器。现在,运行状况监视器会正确执行。
- BZ#2215969
- 在此次更新之前,Google Chrome 没有正确显示负载成员列表,这会阻止成员使用仪表板将成员添加到负载均衡器中。在这个版本中,Google Chrome 显示负载均衡器成员列表。
- BZ#2216130
在此次更新之前,
puppet-ceilometer
不会在 Compute 节点上的 ceilometer 配置中填充tenant_name_discovery
参数。这可以防止识别项目名称和
字段。用户名
在这个版本中,将
tenant_name_discovery
参数添加到puppet-ceilometer
中的 Compute 命名空间可解决这个问题。当tenant_name_discovery
参数设置为true
时,项目名称和
用户名字段将填充。- BZ#2218596
在这个版本中解决了一个程序错误,如果原始 ML2/OVS 环境使用 iptables_hybrid 防火墙和中继端口,在迁移到 OVN 机制驱动程序后造成问题。
在以前的版本中,如果原始 ML2/OVS 环境使用 iptables_hybrid firewall 和 trunk 端口,如果您在事件(如硬重启、启动和停止或节点重启后)重新创建带有中继的实例,则会出现实例网络问题。
现在,如果原始 ML2/OVS 环境使用 iptables_hybrid 防火墙和中继端口,您可以迁移到 OVN 机制驱动程序。
- BZ#2219574
- 在此次更新之前,puppet-ceilometer 不支持为数据收集服务配置缓存选项(ceilometer)。借助此次更新,puppet-ceilometer 为数据收集服务(ceilometer)提供配置缓存选项。此支持使用 tripleo heat 模板,为配置缓存后端提供更好的灵活性。
- BZ#2219613
-
在此次更新之前,在 RHOSP 17.1 分布式虚拟路由器(DVR)环境中,当发送到附加端口的浮动 IP 地址(FIP)时,流量会被错误地集中。
在这个版本中,如果 FIP 端口处于
DOWN
状态,则网络流量不再集中。 - BZ#2220808
-
在此次更新之前,数据收集服务(ceilometer)没有在 gnocchi 中创建资源,因为 gnocchi 的资源类型中缺少
hardware.ipmi.fan
指标。在这个版本中,gnocchi 会报告 fan 指标,用于解决这个问题。 - BZ#2220930
-
在此次更新之前,在运行 DNS 服务(designate)的环境中,如果存在
bind9
和unbound
服务在配置更改时不会自动重启的问题。在这个版本中,如果配置更改,bind9
和unbound
服务会自动重启。 - BZ#2222420
- 在此次更新之前,在使用运行 RHOSP DNS 服务(指定)的 IPv6 网络的环境中,BIND 9 后端服务器会拒绝 DNS 通知信息。在这个版本中,BIND 9 后端服务器不会拒绝 DNS 通知消息。
- BZ#2222825
-
在此次更新之前,当您使用
[quota]count_usage_from_placement = True
配置 Nova 时,您可以取消缩小一个 shelved 卸载的服务器,您可以超过配额限制,因为没有强制配额。在这个版本中,当您使用[quota]count_usage_from_placement = True
配置 Nova 时,您取消了 shelved 卸载的服务器,则会强制实施配额限制。 - BZ#2223294
-
在这个版本中解决了在从 RHOSP 16.2 升级到 17.1 的过程中,在 RHEL 8 Compute 节点上导致集合代理
collectd-sensubility
失败的错误。 - BZ#2226963
-
在此次更新之前,如果 DCN 站点有 3 个
DistributedComputeHCI
节点,且至少 1DistributedComputeHCIScaleOut
节点,cephadm
会生成不正确的 spec。在这个版本中,如果 DCN 站点混合了DistributedComputeHCI
和DistributedComputeHCIScaleOut
节点,cephadm
可以正确地生成 spec。 - BZ#2227360
-
在此次更新之前,NetApp NFS 驱动程序的镜像缓存清理任务会导致其他块存储服务中无法预计。在这个版本中,NetApp NFS 驱动程序的镜像缓存清理任务不再会导致其他块存储服务中无法预计的性能下降。NetApp NFS 驱动程序还提供
netapp_nfs_image_cache_cleanup_interval
配置选项,默认值为 600 秒,它应该适合于大多数情况。 - BZ#2228818
在以前的版本中,当 RHOSP 将 Compute 节点升级到带有 RHEL 9.2 的 RHOSP 17.1 后,nova_virtlogd 容器不会按预期从 ubi 8 更新至 ubi 9。容器只有在重新引导 Compute 节点后才会更新。
现在,nova_virtlogd 容器在 RHOSP 升级前更新至 ubi 9。请注意,在后续的 RHOSP 更新中,您必须在对 virtlogd 容器进行任何更改后重新引导 Compute 节点,因为重启会导致工作负载日志无法访问。
- BZ#2231378
- 在此次更新之前,块存储(cinder)备份服务的 Red Hat Ceph Storage 后端无法正确组成内部备份名称。因此,存储在 Ceph 中的备份无法恢复到非 Ceph 后端中存储的卷。在这个版本中,Red Hat Ceph Storage 后端表单备份名称正确。Ceph 现在可以识别备份的所有重要部分,并可将数据恢复到存储在非 Ceph 后端上的卷。
- BZ#2232562
在此次更新之前,
openstack overcloud deploy
不会将OVNAvailabilityZone
role 参数的值传递给 OVS。在这个版本中,
OVNAvailabilityZone
角色参数可以正确地将值作为external-ids:ovn-cms-options
中的availability-zones
值传递。以下示例演示了如何在环境文件中使用参数来设置 'OVNAvailabilityZone。在部署命令中包括 环境文件。
ControllerParameters: OVNAvailabilityZone: 'az1'
部署将
availability-zones=az1
添加到 OVSexternal-ids:ovn-cms-options
。- BZ#2233136
-
在此次更新之前,当以逗号分隔的列表中提供了多个值时,
CinderNetappNfsShares
参数被错误地解析。因此,无法定义具有多个 NFS 共享的 NetApp 后端。在这个版本中,当使用以逗号分隔的列表中的多个值提供时,CinderNetappNfsShares
参数会被正确解析。因此,定义了带有多个 NFS 共享的 NetApp。 - BZ#2233457
-
在此次更新之前,
cinder-api
服务的 WSGI 日志没有存储在持久位置,这会导致您无法查看日志来排除问题。在这个版本中,WSGI 日志存储在cinder-api
服务在/var/log/containers/httpd/cinder-api
目录中运行的控制器节点中,从而解决这个问题。 - BZ#2233487
- 在此次更新之前,如果您在 RHOSP 环境中使用了 RHOSP 动态路由,且您使用 RHOSP 负载均衡服务(octavia)创建负载均衡器,则 Controller 节点之间的延迟可能会导致 OVN 供应商驱动程序失败。在这个版本中,当在遇到延迟的 Controller 节点上使用 OVN 供应商驱动程序时,负载均衡器会被成功创建。
- BZ#2235621
-
在此次更新之前,当从
registry.redhat.io
拉取镜像时,RHOSP 从 16.2 升级到 17.1 会失败,因为升级 playbook 不包括 Podman registry 登录任务。这个问题已在 RHOSP 17.1.2 中解决。 - BZ#2237245
- 在这个版本中,RHOSP 17.1 环境使用更新到 RHOSP 17.1.2 的动态路由现在可以正常工作。RHOSP director 现在可以成功更新 Free Range Routing (FRR)组件,而无需任何临时解决方案。
- BZ#2237251
-
在此次更新之前,使用带有 OVN 供应商的负载均衡服务(octavia)的 RHOSP 环境会导致负载均衡池显示为
ONLINE
。在这个版本中,如果您为池使用运行状况监控器,则假的负载平衡池成员现在具有ERROR
操作状态,Load Balancer/Listener/Pool 操作状态会相应地更新。 - BZ#2237866
-
在此次更新之前,不支持为 ceilometer 配置缓存参数。有了这个更新,对于缓存,ceilometer 使用
dogpile.cache.memcached
后端。如果手动禁用缓存,celiometer 将使用oslo_cache.dict
后端。 - BZ#2240591
- 在此次更新之前,调用 member batch update API 会触发 Octavia API 服务中的竞争条件,这会导致负载均衡器处于 "PENDING_UPDATE" provisioning_status 中。在这个版本中,调用 member batch update API 不会触发竞争条件,从而解决了这个问题。
- BZ#2242605
-
在此次更新之前,当没有连接到互联网的环境中,从 RHOSP 16.2 升级到 17.1 会失败,因为没有定义
infra_image
值。overcloud_upgrade_prepare.sh
脚本会尝试拉取registry.access.redhat.com/ubi8/pause
,这会导致错误。这个问题已在 RHOSP 17.1.2 中解决。 - BZ#2244631
-
在此次更新之前,当 OVN 元数据和 OVN LB 运行状况监控端口存在于同一环境中时,执行手动 OVN DB 同步会导致 OVN DB 同步删除其中一个端口。如果删除了 OVN 元数据端口,您会丢失与虚拟机的通信。在这个版本中,手动 OVN DB 同步不会删除其中一个端口,因为 OVN-provider 将
ovn-lb-hm:distributed
值用于device_owner
参数。OVN 提供程序将现有 OVN LB Health Monitor 端口更新为ovn-lb-hm:distributed
值。 - BZ#2246563
- 在此次更新之前,director 不包含 puppet 模块和您需要使用 Red Hat Openstack Shared File System Service (manila)配置 Pure Flashblade 驱动程序所需的 heat 模板。在这个版本中,director 包含您的配置所需的 puppet 模块和 heat 模板。
3.2.3. 功能增强
此 Red Hat OpenStack Platform (RHOSP)发行版本包括以下改进:
- BZ#1759007
- 现在支持对多单元环境的升级。
- BZ#1813561
- 在这个版本中,负载均衡服务(octavia)使用应用程序层协议 Negotiation (ALPN)支持 HTTP/2 负载均衡,用于通过传输层安全(TLS)启用的监听程序和池。HTTP/2 协议通过更快地加载页面来提高性能。
- BZ#1816766
- 此功能增强添加了对将压缩镜像上传到镜像服务(glance)的支持。您可以通过减少主机上的镜像上传时间和存储消耗,使用镜像解压缩插件来优化网络带宽。
- BZ#2222699
在这个版本中,在从 OVS 机制驱动程序迁移到 OVN 机制驱动程序后,在租户网络上设置错误的 MTU 值已从 VXLAN 改为 Geneve。在此次更新之前,
cloud-init
软件包覆盖了 DHCP 服务器正确设置的值。例如,在从具有 VXLAN 的 OVS 机制驱动程序迁移到 OVN 机制驱动程序后,使用 1442 MTU 到 Geneve,cloud-init 会将 MTU 重置为 1500。
在这个版本中,DHCP 服务器设置的值会保留。
- BZ#2233695
- 此功能增强添加了对带有 FlexVol 池的 iSCSI、FC 和 NFS 驱动程序的 Revert 到 Snapshot 功能的支持。限制: 这个功能不支持 FlexGroups。另外,您只能恢复到块存储卷的最新快照。
- BZ#2237500
-
在这个版本中,明确了由
openstack-tripleo-validations
生成的错误消息。在以前的版本中,如果在运行验证时找不到主机,该命令会将状态报告为 FAILED。现在,Status 会报告 SKIPPED。
3.2.4. 技术预览
您可以在 Red Hat OpenStack Platform (RHOSP)的这个版本中测试以下技术预览功能。这些功能为您提供对即将推出的产品功能的早期访问,以便您在开发过程中测试并提供反馈。您的红帽订阅不支持这些功能,红帽不推荐在生产环境中使用它们。有关技术预览功能支持范围的更多信息,请参阅 https://access.redhat.com/support/offerings/techpreview/。
- BZ#1848407
- 在 RHOSP 17.1 中,负载均衡服务(octavia)中的流控制传输协议(SCTP)提供了一个技术预览。用户可以在负载均衡器中创建 SCTP 侦听程序并附加 SCTP 池。
- BZ#2217663
在 RHOSP 17.1 中,VF-LAG 传输哈希策略卸载提供了一个技术预览,它允许在 NIC 硬件上进行负载均衡以卸载流量/流。这个哈希策略仅适用于 layer3+4 基础散列。
要使用技术预览,请验证您的模板是否包含绑定选项参数来启用 xmit 哈希策略,如下例所示:
bonding_options: "mode=802.3ad miimon=100 lacp_rate=fast xmit_hash_policy=layer3+4"
3.2.5. 已知问题
目前,Red Hat OpenStack Platform (RHOSP)中存在这些已知问题:
- BZ#2034801
当每个物理功能(PF)创建大量虚拟功能(VF)时,RHOSP 部署可能会失败。NetworkManager 在所有这些请求上发出 DHCP 请求,从而导致 NetworkManager 服务失败。
例如,这个问题会在 4 PF 中包含 256 个 VF 的部署期间发生。
临时解决方案 :避免为每个 PF 创建大量 VF。
- BZ#2107599
-
不要在附加到实例的端口上更改
binding:vnic_type
。这样做会导致nova_compute
在重启时进入重启循环。 - BZ#2160481
在使用 BGP 动态路由的 RHOSP 17.1 环境中,目前存在一个已知问题:浮动 IP (FIP)端口转发失败。
配置 FIP 端口转发时,发送到带有与 FIP 相等的目标 IP 的特定目标端口的数据包将从 RHOSP 网络服务(neutron)端口重定向到内部 IP。无论使用的协议是什么,都会出现这种情况:TCP、UDP 等。
配置 BGP 动态路由时,不公开执行 FIP 端口转发的路由,这些数据包无法访问其最终目的地。
临时解决方案: 目前,没有临时解决方案。
- BZ#2163477
- 在使用 BGP 动态路由的 RHOSP 17.1 环境中,目前存在一个已知问题影响到提供商网络的实例。RHOSP 计算服务无法将从其中一个实例发送到多播 IP 地址目的地的数据包。因此,订阅多播组的实例无法接收发送到它们的数据包。其原因是 overcloud 节点上没有正确配置 BGP 多播路由。临时解决方案: 目前,没有临时解决方案。
- BZ#2178500
-
如果在使用
nova-manage
CLI 时卷刷新失败,这会导致实例保持锁定状态。 - BZ#2187985
添加其子网不在负载均衡服务(octavia)可用区中的负载均衡器成员会将负载均衡器置于
ERROR
。由于ERROR
状态而无法删除成员,使负载均衡器不可用。临时解决方案: 删除负载均衡器。
- BZ#2192913
在启用了 DVR 的 ML2/OVN 或 ML2/OVS 的 RHOSP 环境中,连接到不同租户网络的实例之间的 east/west 流量会产生大量到光纤。
因此,这些实例之间的数据包不仅到达运行这些实例的 Compute 节点,还到达任何其他 overcloud 节点。
这可能会影响网络,这可能是安全风险,因为光纤在任何位置发送流量。
这个错误将在 FDP 以后的发行版本中解决。您不需要执行 RHOSP 更新来获取 FDP 修复。
- BZ#2210319
目前,RHEL 9.2 中的 Retbleed 漏洞缓解可能会导致 Intel Skylake CPU 上使用 Data Plane Development Kit (OVS-DPDK)的 Open vSwitch 的性能下降。
只有在 BIOS 中禁用了 C-states,Hy-Threading Technology 被启用,OVS-DPDK 只使用一个给定内核的逻辑核心时才会发生此性能回归。
临时解决方案: 将逻辑内核分配给 OVS-DPDK 或 SRIOV 客户机,这些客户机按照 NFV 配置指南中所述运行 DPDK。
- BZ#2216021
带有 OVN 机制驱动程序的 RHOSP 17.1 不支持记录每个端口的流事件,或使用
网络日志 create
命令的--target
选项。RHOSP 17.1 支持使用
network log create
命令的--resource
选项为每个安全组记录流事件。如需更多信息,请参阅配置 Red Hat OpenStack Platform 网络 中的日志记录 安全组操作。- BZ#2217867
- 在 Nvidia ConnectX-5 和 ConnectX-6 NIC 上,在使用硬件卸载时,在 PF 上一些卸载流可能会导致关联的 VF 上的临时性能问题。此问题通过 LLDP 和 VRRP 流量特别观察到。
- BZ#2220887
- 数据收集服务(ceilometer)不会过滤单独的电源和当前指标。
- BZ#2222683
目前,以下部署架构不支持 Multi-RHEL:
- Edge (DCN)
- ShiftOnStack
基于 director 的 director 部署
临时解决方案: 在运行列出的构架之一时,在 RHOSP 部署中只使用一个 RHEL 版本。
- BZ#2223916
在使用 ML2/OVN 机制驱动程序的 RHOSP 17.1 GA 环境中,浮动 IP 端口转发无法正常工作。
FIP 端口转发应该在 Controller 或 Networker 节点上集中。相反,当使用 FIP 时,VLAN 和扁平网络分发南北网络流量。
临时解决方案: 要通过集中式网关节点解决这个问题并强制 FIP 端口转发,可将 RHOSP 编排服务(heat)参数
NeutronEnableDVR
设置为false
,或者使用 Geneve 而不是 VLAN 或扁平项目网络。- BZ#2224236
在这个 RHOSP 发行版本中,使用带有 iavf 驱动程序的 Intel X710 和 E810 系列控制器虚拟功能(VF)的 SR-IOV 接口可能会遇到涉及链路状态 flapping 的网络连接问题。受影响的客户机内核版本有:
-
RHEL 8.7.0
8.7.3 (计划没有修复)。生命周期结束。) -
RHEL 8.8.0
8.8.2 (在 8.8.3 版本中计划使用Fix) -
RHEL 9.2.0
9.2.2 (版本 9.2.3 中计划使用Fix) 上游 Linux 4.9.0
6.4 65534 (在 6.5. 中计划使用Fix) 临时解决方案: 除了使用未影响的客户机内核外,还有其他问题。
-
RHEL 8.7.0
- BZ#2231893
元数据服务在多个尝试启动 HAProxy 子容器失败时,元数据服务可能会不可用。元数据代理记录类似:"ProcessExecutionError: Exit code: 125; Stdin: ; Stdout: Starting a new child container neutron-haproxy-ovnmeta-<uuid>" 的错误消息。
临时解决方案: 运行
podman kill <_container name_&
gt; 以停止有问题的 haproxy 子容器。- BZ#2231960
- 当块存储卷使用 Red Hat Ceph Storage 后端时,当从这个卷创建快照时,无法删除卷,然后从此快照中创建卷克隆。在这种情况下,当卷克隆存在时,您无法删除原始卷。
- BZ#2237290
网络服务(neutron)不会阻止您禁用或删除网络配置文件,即使该配置集是路由器正在使用的类别的一部分。禁用或删除配置集可能会破坏路由器的正确操作。
临时解决方案: 在禁用或删除网络配置集前,请确保它不是路由器当前使用的类别的一部分。
- BZ#2241270
-
frr-status
和oslo-config-validator
验证在更新过程中报告 FAILED。您可以忽略这些错误消息。它们特定于验证代码,不指明任何影响 17.1 操作的条件。以后的发行版本中将修复它们。 - BZ#2241326
-
LDAP 服务器连接会如预期从
TIMEOUT
或SERVER_DOWN
错误上的 Keystone LDAP 池中删除。LDAP 池耗尽其连接,且无法重新建立新的连接。已发出MaxConnectionReachedError
。临时解决方案: 禁用LDAP 池
。 - BZ#2242439
-
启用
localnet_learn_fdb
后,不同 Compute 节点托管的两个实例之间的流量可能会发生数据包丢失。这是一个核心 OVN 问题。要避免这个问题,请不要启用localnet_learn_fdb
。 - BZ#2249690
-
如果 DCN FFU 有多个集群,Ceph 集群升级会失败,因为它们无法在第一个 Ceph 集群升级过程中找到
ceph-ansible
软件包。 - BZ#2251176
Ceph 控制面板无法访问 Prometheus 服务端点,并显示以下出错信息: 404 not found。发生此错误的原因是为 Prometheus 服务配置 VIP 不正确。
临时解决方案:
-
验证 haproxy 是否已正确配置:ssh 到控制器节点(如 controller-0),并运行
curl http://10.143.0.25:9092
。如果 curl 成功,则配置是正确的。 如果
curl
成功,ssh 到控制器节点,并更新 ceph 集群中的 prometheus API 配置:$ sudo cephadm shell -- ceph dashboard set-prometheus-api-host http://10.143.0.25:9092
要验证 Ceph 控制面板是否可以访问 Prometheus 服务端点,并且不再显示 404 not found 错误消息,请检查 Ceph Dashboard UI。
-
验证 haproxy 是否已正确配置:ssh 到控制器节点(如 controller-0),并运行
- BZ#2252723
当使用 overcloud-hardened-uefi-full.raw 镜像置备时,一些 AMD 环境无法引导,因为包含的内核参数
console=ttyS0
。因此,引导序列会在没有诊断或错误消息的情况下停止。临时解决方案: 运行以下命令以编辑 overcloud 镜像:
sudo yum install guestfs-tools -y sudo systemctl start libvirtd sudo virt-customize -a /var/lib/ironic/images/overcloud-hardened-uefi-full.raw \ --run-command "sed -i 's/console=ttyS0 //g' /etc/default/grub" \ --run-command "grub2-mkconfig -o /boot/grub2/grub.cfg" \ --run-command "grub2-mkconfig -o /boot/efi/EFI/redhat/grub.cfg"
运行这些命令后,您可以使用 provision 命令置备 AMD 节点。
- BZ#2254036
- 在 director 部署的 Ceph 升级过程中,如果 CephClusterName 变量被覆盖为 "ceph" 以外的值,升级过程会失败。所有分布式计算节点(DCN)部署都会覆盖此变量。
- BZ#2254553
-
在 Red Hat Ceph Storage 6 中,目前存在一个已知问题:当提供了有效网络列表时,
cephadm
会尝试将 Grafana 守护进程绑定到所有接口。这可防止 Grafana 守护进程启动。 - BZ#2254994
在包含之前版本中负载平衡服务(octavia)运行状况监控端口的 RHOSP 17.1.2 环境中,运行
neutron-db-sync-tool
可能会随机删除这些预先存在的端口或 OVN 元数据端口。这种意外删除端口会导致健康监控容量丢失,或者与受影响的实例通信丢失。临时解决方案:手动将现有负载均衡服务运行状况监控端口上的 'device_owner' 字段手动更新
ovn-lb-hm:distributed
。这样做可确保如果启动neutron-db-sync-tool
,则运行状况监视器或 OVN 元数据端口不会受到负面影响。- BZ#2255302
如果您的部署有多个文件系统的外部 Ceph 集群,则无法按预期创建共享文件系统服务(Manila)共享。
cephfs_filesystem_name
驱动程序配置参数需要避免这种情形,无法使用 director 的 heat 模板参数设置。临时解决方案 :设置 "cephfs_filesystem_name" 参数,以指定共享文件系统服务(Manila)必须通过 "ExtraConfig" 使用的文件系统。
在环境文件中添加参数,如下例所示:
$ cat /home/stack/manila_cephfs_customization.yaml parameter_defaults: ExtraConfig: manila::config::manila_config: cephfs/cephfs_filesystem_name: value: <filesystem>
将 <filesystem> 值替换为适当的名称,并将此环境文件替换为
openstack overcloud deploy
命令。- BZ#2255324
director 程序错误可能会在更新或升级到任何 RHOSP 17.1 版本过程中中断或崩溃客户端工作负载。这个错误会影响使用 CephFS-via-NFS 后端启用 RHOSP 共享文件系统服务(manila)的部署。
错误会导致在更新或升级操作过程中删除 Ceph NFS 导出信息。当用户在其共享上设置"访问规则"时,此导出信息由共享文件系统服务(manila)创建。
当 NFS 服务器进入恢复模式时,如果客户端工作负载主动读取或写入到 NFS 共享,客户端工作负载可能会挂起并最终崩溃。
临时解决方案 : 因为导出信息丢失,请参阅 Red Hat OpenStack 17.1 的 Manila 共享可能会崩溃。