3.4. Red Hat OpenStack Platform 17.1 GA - 2023 年 8 月 17 日
部署此 RHOSP 发行版本时,请考虑 Red Hat OpenStack Platform (RHOSP)中的以下更新。
3.4.1. 公告列表
此发行版本包括以下公告:
- RHEA-2023:4577
- Red Hat OpenStack Platform 17.1 (Wallaby)组件发行版本.
- RHEA-2023:4578
- Red Hat OpenStack Platform 17.1 (Wallaby)的容器发行版本.
- RHEA-2023:4579
- Red Hat OpenStack Platform 17.1 RHEL 9 部署镜像
- RHEA-2023:4580
- Red Hat OpenStack Platform 17.1 (Wallaby)组件发行版本.
- RHEA-2023:4581
- Red Hat OpenStack Platform 17.1 (Wallaby)的容器发行版本.
- RHSA-2023:4582
- 中等:Red Hat OpenStack Platform 17.1 director Operator 的容器发行版本
3.4.2. 程序错误修复
此 Red Hat OpenStack Platform (RHOSP)发行版本中解决了这些程序错误:
- BZ#1965308
- 在此次更新之前,当您使用与成员子网相同的网络使用不同的子网时,负载均衡服务(octavia)可能会拔出所需的子网。附加到此子网的成员无法访问。在这个版本中,负载均衡服务不会拔出所需的子网,负载均衡器可以访问子网成员。
- BZ#2007314
-
在此次更新之前,因为
nova_libvirt
容器中 SElinux 配置存在问题,无法使用模拟受信任的平台模块(TPM)设备创建实例。在这个版本中,部署工具可以正确地配置 SElinux,从而解决了这个问题。 - BZ#2066866
-
虽然 Panko 监控服务已被弃用,但在从 RHOSP 16.2 升级到 17.1 后,其端点仍然存在于 Identity 服务(keystone)中。在这个版本中,清理 Panko 服务端点。但是,Panko 服务用户不会被自动删除。您必须使用命令
openstack user delete panko
手动删除 Panko 服务用户。如果没有删除这些用户,则没有影响。 - BZ#2073530
- RHOSP 17.0 中不支持 Windows Server 2022 客户机操作系统,因为它需要 vTPM,因为因为 SElinux 配置问题,不提供 vTPM。这个问题已被解决,RHOSP 17.1 中支持 Windows Server 2022 客户机操作系统。
- BZ#2080199
- 在此次更新之前,在从 RHOSP 16.2 升级到 17.0 的过程中不会清理从 undercloud 中删除的服务。移除的服务保留在 OpenStack 端点列表中,即使它们无法访问或正在运行。在这个版本中,RHOSP 升级包括 Ansible 任务来清理不再需要的端点。
- BZ#2089512
- 由于 RHOSP 17.0,多堆栈和多堆栈 overcloud 功能在 RHOSP 17.0 中不可用。修复了回归问题,RHOSP 17.1 中支持多单元和多堆栈部署。
- BZ#2092444
在此次更新之前,即使删除了
metalsmith
工具,裸机 overcloud 节点也被列为 active。在节点命名方案与 overcloud 角色命名方案重叠的环境中发生,这可能会导致错误的节点在取消部署过程中被取消置备。由于metalsmith
工具首先使用分配名称(hostname)查找裸机节点的状态,所以它有时会发现已删除的节点仍处于活动状态。在这个版本中,要取消置备的节点现在被分配名称(hostname)引用,这样可确保始终取消置备正确的节点。只有主机名不存在,则节点仅由节点名称引用。
- BZ#2097844
-
在此次更新之前,
overcloud 配置下载
命令会失败,并显示回溯错误,因为命令试图访问编排服务(heat)来执行下载。编排服务不再永久在 undercloud 上运行。在这个版本中,overcloud config download
命令已被删除。相反,您可以将overcloud deploy
命令与--stack-only
选项搭配使用。 - BZ#2101846
- 在此次更新之前,如果启用了安全 RBAC,RHOSP 部署中缺少的角色可能会导致负载均衡服务(octavia) API 失败。在 RHOSP 17.1 GA 中,这个问题已被解决。
- BZ#2107580
-
在此次更新之前,director 用来停止来自 RHOSP 17.0, 之前的版本中的
libvirtd
过时的libvirt
容器名称的关闭脚本,实例不会被安全关闭。在这个版本中,脚本存储了正确的libvirt
容器名称,并在libvirtd
停止时安全地关闭实例。 - BZ#2109616
- 在此次更新之前,计算服务无法使用 VGPU 资源,因为中介设备名称格式在 libvirt 7.7 中有所变化。在这个版本中,Compute 服务可以解析新的介质设备名称格式。
- BZ#2116600
- 在此次更新之前,在成功实时迁移过程中有时会引发以下 libvirt 内部错误:"迁移处于活动状态,但没有设置 RAM 信息"。这会导致实时迁移在应该成功时失败。在这个版本中,当提高此 libvirt 内部错误时,实时迁移会在 libvirt 驱动程序中完成,实时迁移可以正确地成功。
- BZ#2120145
-
在此次更新之前,libvirt
max_client
参数的低默认值会导致 libvirt 和计算服务(nova)之间的通信问题,这会导致一些失败的操作,如实时迁移。在这个版本中,您可以自定义max_client
参数设置并增加其值以提高 libvirt 和计算服务之间的通信。 - BZ#2120767
- 由于某些机器类型中缺少 RHEL 固件定义文件的已知问题,RHOSP 17.0 中无法使用 AMD SEV 功能。这个问题已被解决,RHOSP 17.1 支持 AMD SEV。
- BZ#2125610
- 在此次更新之前,SELinux 问题会触发使用 Amphora 供应商驱动程序的 Red Hat OpenStack Platform (RHOSP)负载均衡服务(octavia) ICMP 运行状况监控器的错误。在 RHOSP 17.1 中,这个问题已被解决,ICMP 健康监控器可以正常工作。
- BZ#2125612
-
在此次更新之前,当负载均衡器使用多个并发会话加载时,用户可能会在负载均衡服务(octavia)的 amphora 日志文件中遇到以下警告信息:
nf_conntrack: table full, discard packet
.如果 amphora 丢弃了传输控制协议(TCP)流,并导致用户流量延迟,则会出现这个错误。在这个版本中,对于使用 amphora 的负载均衡服务中的 TCP 流禁用连接跟踪(conntrack),新的 TCP 流不会被丢弃。conntrack 只适用于用户数据报协议(UDP)流。 - BZ#2129207
- 在此次更新之前,身份服务(keystone)的网络中断或临时不可用会导致 nova-conductor 服务无法启动。在这个版本中,nova-conductor 服务会记录一个警告,并在存在可能临时中断时继续启动。因此,如果在启动过程中遇到必要服务的临时问题或临时不可用,nova-conductor 服务将无法启动。
- BZ#2133027
- Alarming 服务(aodh)使用已弃用的 gnocchi API 来聚合指标,这会导致 gnocchi 中 CPU 使用率不正确。在这个版本中,gnocchi 中的动态聚合支持重新聚合现有指标以及根据需要操作和转换指标的功能。gnocchi 中的 CPU 时间会被正确计算。
- BZ#2133297
-
在此次更新之前,
openstack undercloud install
命令启动openstack tripleo deploy
命令,该命令创建了/home/stack/.tripleo/history
文件,其所有者为root:root
。由于权限错误,后续的部署命令会失败。在这个版本中,命令会创建stack
用户作为所有者的文件,并且部署命令会成功,且无权限错误。 - BZ#2135548
-
在此次更新之前,
ironic-python-agent
无法正确处理 UEFI 引导装载程序提示文件,从而导致在 UEFI 模式下使用 RHEL 8.6 镜像进行部署失败。在这个版本中,您可以在 UEFI 模式中部署 RHEL 8.6。 - BZ#2136302
- 在这个版本中,节点名称大于 62 字节。
- BZ#2140988
在此次更新之前,实时迁移可能会失败,因为数据库没有使用目标主机详情进行更新。
在这个版本中,数据库中的实例主机值在实时迁移过程中被设置为目标主机。
- BZ#2149216
在此次更新之前,如果您使用与 Load Balancer Virtual IP (VIP)关联的浮动 IP (FIP),并且流量被重定向到使用 FIP 在 Error 状态下的成员时,不会执行 Open Virtual Network (OVN)负载均衡器健康检查。
在这个版本中,如果您使用与 Load Balancer Virtual IP (VIP)关联的浮动 IP (FIP),则为 FIP 创建新的负载均衡器健康检查,流量不会重定向到 Error 状态的成员。
- BZ#2149221
-
在此次更新之前,带有绑定接口的部署没有完成,因为没有为 OVS 绑定的 Ansible 变量设置值
bond_interface_ovs_options
。在这个版本中,为bond_interface_ovs_options
Ansible 变量设置了默认值。 - BZ#2149339
在此次更新之前,
/home/stack/config-download/overcloud/cephadm
中的 cephadm-ansible 日志不会被轮转。cephadm_command.log
为每个 overcloud 部署附加并增大大小。另外,对于每个openstack overcloud ceph spec
操作,日志/home/stack/ansible.log
没有轮转。现在,会为每个 overcloud 部署生成日期的日志,并以以下格式的每个 Ceph spec 操作:
-
/home/stack/config-download/overcloud/cephadm/cephadm_command.log-<Timestamp>
. -
/home/stack/ansible.log-<Timestamp>
.
-
- BZ#2149468
- 在此次更新之前,Compute 服务(nova)处理来自块存储服务(cinder)卷分离 API 的临时错误消息,如 '504 Gateway Timeout',作为错误。Compute 服务失败了卷分离操作,即使它成功但会在块存储服务端超时,在计算服务数据库中保留过时的块设备映射记录。在这个版本中,如果 Compute 服务收到可能临时的 HTTP 错误,则计算服务会重试对块存储服务 API 的卷分离调用。重试时,如果不再找到卷附加,则计算服务会将卷作为已分离的处理。
- BZ#2149963
- 在此次更新之前,当从清单中构建规格文件时,cephadm 实用程序不会处理子组。在这个版本中,规范文件生成进程子组。
- BZ#2151043
-
在此次更新之前,
openstack-cinder-volume-0
容器,由 Pacemaker 捆绑包资源为块存储服务(cinder)创建,从主机挂载/run
。此挂载路径在目录中创建.containerenv
文件。当.containerenv
文件存在时,subscription-manager
会失败,因为它评估了在容器内执行该命令。在这个版本中,挂载路径被更新,以便 Podman 禁用创建.containerenv
文件,而subscription-manager
在运行openstack-cinder-volume-0
容器的主机上成功执行。 - BZ#2152888
- 在此次更新之前,Service Telemetry Framework (STF) API 健康监控脚本会失败,因为它依赖于 Podman 日志内容,这不再可用。在这个版本中,健康监控脚本依赖于 Podman 套接字而不是 Podman 日志,API 健康监控会正常运行。
- BZ#2154343
- 在此次更新之前,在安全组中禁用和启用网络日志对象不一致。当与那个连接关联的安全组中的其中一个日志对象被禁用时,连接登录就会被禁用。在这个版本中,如果安全组中的任何相关的日志对象允许它,则会记录连接,即使其中一个日志对象被禁用。
- BZ#2162632
- 在此次更新之前,在 Alarming 服务(aodh)配置中没有正确填充多值参数的值,因为对多值参数的输入没有被视为数组而不是单个值。在这个版本中,您可以为参数设置多个值,所有值都会在配置文件中填充。
- BZ#2162756
- 在此次更新之前,VLAN 网络流量通过 Controller 节点进行集中式。在这个版本中,如果连接到路由器的所有租户提供商网络都是 VLAN/Flat 类型,则流量现在被分发。包含实例的节点直接发送流量。
- BZ#2163815
-
在此次更新之前,如果流量来自
localnet
,Open Virtual Network (OVN)负载均衡器无法在带有localnet
端口(网络服务 [neutron] 提供商网络)的交换机上正常工作。在这个版本中,负载均衡器不会添加到与提供商网络关联的逻辑交换机中。这个版本强制网络地址转换(NAT)在虚拟路由器级别而不是逻辑交换机级别进行。 - BZ#2164421
在此次更新之前,计算服务(nova)不会自信检查虚拟机磁盘(VMDK)镜像文件的内容。通过使用特殊精心设计的 VMDK 镜像,可以将主机文件系统上的敏感文件公开给使用该 VMDK 镜像引导的客户机。在这个版本中,Compute 服务会信任检查 VMDK 文件并禁止泄漏行为所依赖的 VMDK 功能。不再可以使用特殊精心设计的 VMDK 文件泄漏敏感主机文件系统内容。此程序错误修复解决了 CVE-2022-47951 的问题。
注意红帽不支持 RHOSP 中的 VMDK 镜像文件格式。
- BZ#2164677
- 在此次更新之前,heat-cfn 服务的 iptables 规则包含不正确的 TCP 端口号。如果为公共端点启用了 SSL,用户无法访问 heat-cfn 服务端点。在这个版本中,iptables 规则中的 TCP 端口号是正确的。用户可以访问 heat-cfn 服务端点,即使为公共端点启用了 SSL。
- BZ#2167161
在此次更新之前,
rgw_max_attr_size
的默认值为 256,它在上传大型镜像时为 OpenStack 上 OpenShift 造成问题。在这个版本中,rgw_max_attr_size
的默认值为 1024。您可以通过在 overcloud 部署中包含的环境文件中添加以下配置来更改值:
parameters_default: CephConfigOverrides: rgw_max_attr_size: <new value>
- BZ#2167431
-
在此次更新之前,当尝试访问名为
demote
的 Red Hat Enterprise Linux (RHEL) 9 中的新文件时,collectd hugepages 插件会报告一个失败信息。现在,collectd 避免读取此文件,失败信息会被禁止。 - BZ#2169303
-
在此次更新之前,IPMI 代理容器没有生成,因为 CeilometerIpmi 服务没有添加到 THT Compute 角色中。在这个版本中,CeilometerIpmi 服务添加到所有 THT Compute 角色。IPMI 代理容器使用
--privilege
标志执行,以在主机上执行ipmitool
命令。数据收集服务(ceilometer)现在可以捕获电源指标。 - BZ#2169349
- 在此次更新之前,实例丢失了与 ovn-metadata-port 的通信,因为负载均衡器运行状况监控器会请求 OVN 元数据代理的 ARP 请求,从而导致请求发送到另一个 MAC 地址。在这个版本中,ovn-controller 使用专用端口而不是 ovn-metadata-port 来执行后端检查。在为负载均衡器池建立运行状况监控器时,请确保 VIP 负载均衡器的子网中有一个可用的 IP。此端口因每个子网而异,同一子网中的各种运行状况监视器可以重复利用该端口。运行状况监视器检查不再影响实例的 ovn-metadata-port 通信。
- BZ#2172063
-
在此次更新之前,如果 chrony NTP 服务停机,则
openstack overcloud ceph deploy
命令在apply spec
操作过程中可能会失败。在这个版本中,在应用 spec
操作前会启用 chrony NTP 服务。 - BZ#2172582
-
在此次更新之前,
创建池操作会失败
,因为 podman 命令使用/etc/ceph
作为卷参数。此参数不适用于 Red Hat Ceph Storage 版本 6 容器。在这个版本中,podman 命令使用/var/lib/ceph/$FSID/config/
作为第一个卷参数,并创建池
操作成功。 - BZ#2173101
-
在此次更新之前,当用户在 tripleo-ipa 上下文中部署 Red Hat Ceph Storage 时,
stray 主机
警告会显示 Ceph 对象网关(RADOS Gateway [RGW])的集群中。在这个版本中,在 Ceph Storage 部署期间,您可以在 tripleo-ipa 上下文中传递--tld
选项,以便在创建集群时使用正确的主机。 - BZ#2173575
- 在此次更新之前,当实例与禁用端口安全性的提供商网络关联时,会尝试访问 OpenStack 无法识别的提供商网络上的 IP。这种填充发生,因为转发数据库(FDB)表没有学习 MAC 地址。在这个版本中,OVN 中使用新的选项来学习 FDB 表中的 IP。FDB 表目前没有老化的机制。但是,您可以定期清理 FDB 表,以防止出现由此表大小导致的扩展问题。
- BZ#2174632
在此次更新之前,OVS 接口的网络配置中的回归会影响网络性能。在这个版本中,o
sos-vif
OVS 插件已被改进,以提高非 Windows 实例的 OVS 接口上的网络性能。重要在这个版本中,当实例接口被重新创建时,这个更新生效。如果为现有端口更改这个值,则必须硬重启实例或执行实时迁移才能使更新生效。
- BZ#2178618
-
在此次更新之前,安全组日志记录增强引入了一个问题,当日志对象与安全组同时无法同时删除。此操作会导致内部服务器错误。在这个版本中,如果请求的行不存在,则修改北向数据库条目的
db_set
函数不会失败。 - BZ#2179071
-
在此次更新之前,collectd 插件 libpodstats 无法收集指标,因为 RHEL 9 中的 Cgroup 路径从
/sys/fs/cgroup/machine.slice
改为 /sys/fs/cgroup/system.slice/system-ceph<FSID>
;。在这个版本中,libpodstats 可以在新路径下从 cgroups 解析 CPU 和内存指标。 - BZ#2180933
-
在此次更新之前,主机服务(如 Pacemaker)被挂载到 rsyslog 容器的
/var/log/host/
下。但是,配置路径与主机路径/var/log/pacemaker/
相同。因此,rsyslog 服务无法找到 Pacemaker 日志文件。在这个版本中,Pacemaker 日志路径从/var/log/pacemaker/
改为/var/log/host/pacemaker/
。 - BZ#2181107
-
在此次更新之前,
NetworkDeploymentAction
参数内部被覆盖,部署过程始终配置网络接口。因此,无论NetworkDeploymentAction
参数的值是什么,网络接口始终在部署期间配置。在这个版本中,NetworkDeploymentAction
参数可以正常工作,并为已部署的节点跳过网络接口配置。 - BZ#2185163
- 在此次更新之前,在部署期间重复使用现有的 puppet 容器。部署过程没有从容器内执行的 puppet 命令检查返回代码,这意味着部署期间会忽略任何 puppet 任务失败。这会导致在一些 puppet 执行任务失败时报告成功部署。在这个版本中,会为每个部署重新创建 puppet 容器。如果 puppet 执行任务失败,部署将停止并报告失败。
- BZ#2188252
-
在此次更新之前,'openstack tripleo container image prepare' 命令失败,因为
container_image_prepare_defaults.yaml
文件中有不正确的 Ceph 容器标签。在这个版本中,正确的 Ceph 容器标签位于 YAML 文件中,'openstack tripleo container image prepare' 命令成功。 - BZ#2196288
-
在此次更新之前,如果您将操作系统从 RHEL 7.x 升级到 RHEL 8.x,或从 RHEL 8.x 升级到 RHEL 9.x,并使用
--debug
选项运行 Leapp 升级,则系统保留在设置代码状态的早期控制台中
,且不会自动重启。在这个版本中,UpgradeLeappDebug
参数默认设置为false
。不要在您的模板中更改这个值。 - BZ#2203238
- 在此次更新之前,为了使 nova-compute 日志记录 os-brick 特权命令以进行调试,您必须应用 https://access.redhat.com/articles/5906971 中概述的临时解决方案。在这个版本中,临时解决方案是多余的,它提供了一个更好的解决方案,它通过 nova-compute 服务分隔日志,以便 os-brick 的特权命令记录在 debug 级别,但没有记录 nova 特权命令。
- BZ#2207991
-
在此次更新之前,安全基于角色的访问控制(SRBAC)和
NovaShowHostStatus
参数使用相同的策略键标题。如果您同时配置了 SRBAC 和NovaShowHostStatus
,则部署会失败并带有冲突。在这个版本中,NovaShowHostStatus
的策略密钥已更改,部署中没有相关的冲突。 - BZ#2210062
在此次更新之前,在使用 RHOSP 动态路由的 RHOSP 17.1 环境中,存在一个已知问题:OVN BGP 代理使用的 Autonomous System Number (ASN)的默认值与 FRRouting (FRR)使用的 ASN 不同。
在 17.1 GA 中,这个问题已解决。
FrrOvnBgpAgentAsn
和FrrBgpAsn
默认值有效,无需修改它们。- BZ#2211691
- 在此次更新之前,Bare Metal Provisioning 服务(ironic)无法从物理裸机节点中分离块存储服务(cinder)卷。通过使用从卷功能的引导,需要使用这个卷分离来停止在其上部署有实例的物理计算机。在这个版本中,裸机置备服务(ironic)可以将卷从物理裸机节点分离,以自动停止这些物理机器。
- BZ#2211849
-
在此次更新之前,库
pyroute2
中的一个程序错误会导致使用 RHOSP 动态路由无法公告新路由,并丢失与新的或迁移实例的连接、新的负载均衡器等。在 RHOSP 17.1 GA 中,新版本的pyroute2
解决了这个问题。 - BZ#2214259
- 在此次更新之前,在从 OVS 机制驱动程序迁移到 OVN 机制驱动程序的环境中,在实时迁移等操作后无法访问具有中继端口的实例。现在,您可以在迁移到 OVN 机制驱动程序后实时迁移、关闭或重启带有中继端口的实例。
- BZ#2215936
- 在此次更新之前,使用虚拟功能(VF)创建实例可能会在从带有 SR-IOV 的 ML2/OVS 迁移到 ML2/OVN 的环境中失败。现在,您可以在迁移后创建带有 VF 的实例。
- BZ#2216130
-
目前,
puppet-ceilometer
不填充 Compute 节点上的数据收集服务(ceilometer)配置中的tenant_name_discovery
参数。这会导致无法识别Project name
和User name
字段。目前,这个问题还没有临时解决方案。 - BZ#2219765
-
在此次更新之前,在某些容器中启用了
pam_loginuid
模块。这导致 crond 无法在这些容器内执行一些任务,如 db purge
。现在,pam_loginuid
已被删除,容器化的crond
进程会运行所有定期的任务。
3.4.3. 功能增强
此 Red Hat OpenStack Platform (RHOSP)发行版本包括以下改进:
- BZ#1369007
- 当 overcloud 包含 UEFI 安全引导节点时,云用户可以启动通过 UEFI 安全引导保护的实例。有关为 UEFI 安全引导创建镜像的详情,请参考 为 UEFI 安全引导创建镜像。有关为 UEFI 安全引导 创建类别的详情,请参考类别元数据中的 "UEFI 安全引导"。
- BZ#1581414
在此次更新之前,在 RHOSP 部署的生命周期内无法更改
NovaHWMachineType
,因为没有hw_machine_type
镜像属性的机器类型会在硬重启或迁移后使用新配置的机器类型。更改实例的底层机器类型可能会破坏实例的内部 ABI。在这个版本中,当启动实例时,计算服务会在实例的系统元数据中记录实例类型。因此,现在可以在 RHOSP 部署生命周期内更改
NovaHWMachineType
,而不影响现有实例的机器类型。- BZ#1619266
这个版本引入了安全组日志记录功能。要监控流量流并尝试使用实例,您可以为安全组配置网络服务数据包日志记录。
您可以将任何实例端口与一个或多个安全组关联,并为每个安全组定义一个或多个规则。例如,您可以创建一个规则来丢弃到 finance 安全组中任何实例的入站 ssh 流量。您可以创建另一个规则,以允许该组中的实例发送和响应 ICMP (ping)消息。
然后,您可以将数据包日志记录配置为记录接受和丢弃的数据包流的组合。
您可以将安全组日志记录用于有状态和无状态安全组。
日志记录的事件存储在托管实例的 Compute 节点上,位于
/var/log/containers/stdouts/ovn_controller.log
文件中。- BZ#1666804
-
有了这个更新,
cinder-backup
服务现在可以在 Active/Active 模式中部署。 - BZ#1672972
此功能增强可帮助云用户确定他们无法访问"ACTIVE"实例的原因,因为托管该实例的 Compute 节点无法访问。现在,当主机 Compute 节点无法访问时,RHOSP 管理员可以配置以下参数,以启用自定义策略,这可以在云用户运行
openstack show server details
命令时可以提供host_status
自动的状态:-
NovaApiHostStatusPolicy
:指定自定义策略应用到的角色。 -
NovaShowHostStatus
:指定要向云用户显示的主机状态级别,如 "UNKNOWN"。
-
- BZ#1693377
-
在这个版本中,一个实例可以混合有共享(floating) CPU 和专用(固定)CPU,而不是只有一个 CPU 类型。RHOSP 管理员可以使用
hw:cpu_policy=mixed
和hw_cpu_dedicated_mask
类别额外规格来为需要共享 CPU 和专用 CPU 混合的实例创建类别。 - BZ#1701281
- 在 RHOSP 17.1 中,支持冷迁移和调整具有 vGPU 的实例的大小。
- BZ#1720404
在这个版本中,您可以通过从 API 数据库中的实例映射查询资源使用情况和实例,而不是从单独的单元数据库计算资源,将 RHOSP 部署配置为计算内核和 RAM 的配额使用量。这样,在出现单元临时下线时或在多单元环境中的单元性能较差时,配额使用量仍然可以正常使用。
设置以下配置选项以计算来自放置的配额使用量:
parameter_defaults: ControllerExtraConfig: nova::config::nova_config: quota/count_usage_from_placement: value: 'True'
- BZ#1761861
- 在这个版本中,您可以在 Compute 节点上配置每个物理 GPU,以支持不同的虚拟 GPU 类型。
- BZ#1761903
-
在使用路由提供商网络的 RHOSP 部署中,您现在可以配置计算调度程序来过滤与路由网络段关联的 Compute 节点,并在将实例调度到 Compute 节点上前验证放置中的网络。您可以使用
NovaSchedulerQueryPlacementForRoutedNetworkAggregates
参数启用此功能。 - BZ#1772124
-
在这个版本中,您可以使用新的
NovaMaxDiskDevicesToAttach
heat 参数指定可附加到单个实例的最大磁盘设备数。默认值为无限(-1)。如需更多信息,请参阅配置要附加到一个实例的存储设备的最大数量。 - BZ#1782128
-
在 RHOSP 17.1 中,RHOSP 管理员可以向云用户提供创建具有模拟虚拟信任平台模块(vTPM)设备的实例。RHOSP 只支持 TPM 版本
2.0
。 - BZ#1793700
-
在 RHOSP 17.1 中,RHOSP 管理员可以通过对 YAML 文件
provider.yaml
中的自定义特征和清单建模,在 RHOSP overcloud 节点上提供哪些自定义物理功能和可消耗的资源。 - BZ#1827598
- 此 RHOSP 发行版本引进了对 OpenStack 无状态安全组 API 的支持。
- BZ#1857652
- 在这个版本中,完全支持使用中继端口部署 RHOSP,从 ML2/OVS 迁移到 ML2/OVN。
- BZ#1873409
- 在为 OVS 硬件卸载和使用 ML2/OVN 配置的 RHOSP 部署中,以及具有 VirtIO 数据路径加速(VDPA)设备和驱动程序和 Mellanox NIC 的 Compute 节点,您可以为企业工作负载启用 VDPA 支持。启用 VDPA 支持后,您的云用户可以创建使用 VDPA 端口的实例。如需更多信息,请参阅配置 VDPA Compute 节点,以启用使用 VDPA 端口和 创建带有 VDPA 接口的实例。
- BZ#1873707
在这个版本中,您可以使用备份和恢复工作流中的验证框架来验证恢复的系统状态。包括以下验证:
-
undercloud-service-status
-
neutron-sanity-check
-
Healthcheck-service-status
-
nova-status
-
ceph-health
-
check-cpu
-
service-status
-
image-serve
-
pacemaker-status
-
validate-selinux
-
container-status
-
- BZ#1883554
-
在这个版本中,RHOSP 管理员可以创建具有
套接字
PCI NUMA 关联性策略的类别。当至少有一个实例 NUMA 节点与与 PCI 设备相同的主机套接字中的 NUMA 节点关联性时,您可以使用此策略创建请求 PCI 设备的实例。 - BZ#1888788
-
在这个版本中,共享文件系统服务(manila) API 支持项目范围 'reader' 角色。具有 'reader' 角色的用户可以将 GET 请求发送到服务,但无法发出任何其他类型的请求。您可以使用 director 中包含的
environments/enable-secure-rbac.yaml
环境文件来启用此功能。您可以使用 'reader' 角色为人工和自动化创建审计用户,并与 OpenStack API 安全执行只读交互。 - BZ#1898349
- 在这个版本中,块存储(cinder)备份服务支持 zstd 数据压缩算法。
- BZ#1903914
- 在这个版本中,块存储(cinder)备份服务支持 S3 后端。
- BZ#1947377
- 在这个版本中,RHOSP Orchestration 服务(heat)仪表板显示模板默认值。在以前的版本中,heat 仪表板具有隐藏的默认值,这有时会给用户造成混淆。在这个版本中,这些默认值在 heat 仪表板中对用户可见,并删除在隐藏时导致的任何混淆。
- BZ#1962500
- 在这个版本中,您可以在 TripleO Heat 模板中配置 collectd 日志记录源。默认值与默认日志记录路径匹配。
- BZ#1986025
- 在这个版本中,块存储服务(cinder)支持 NVMe over TCP (NVMe/TCP)驱动程序,用于运行 RHEL 9 的 Compute 节点。
- BZ#2005495
此功能增强允许云管理员在配置共享文件系统服务(manila)后端存储时,通过 director 指定存储后端的可用区(AZ)。
在这个版本中,管理员可以使用 AZ 注解来逻辑地分隔存储置备请求,并表示故障域。管理员配置的 AZ 由共享文件系统服务向最终用户公开。最终用户可以请求其工作负载根据其需要调度到特定的 AZ。在配置多个存储后端时,管理员可能希望将每个后端标记为不同的 AZ,而不是将所有后端都禁止一个 AZ。
director 有新选项来表示存储 AZ。每个选项都对应一个受支持的存储后端驱动程序。有关 AZ 的更多信息,请参阅 配置持久性存储。
- BZ#2008969
- 在这个版本中,云管理员可在共享文件系统服务管理下将创建在共享文件系统服务(manila)外创建的共享。云管理员也可以从共享文件系统服务中删除共享,而不删除它们。请注意,CephFS 驱动程序不支持此功能。在委托、停用或迁移存储系统时,您可以使用此管理/取消管理的功能,或者临时关闭共享以进行维护。
- BZ#2016660
- 支持从 Red Hat OpenStack Platform (RHOSP) 16.2 升级到 RHOSP 17.1。RHOSP 升级和操作系统升级现在分为两个不同的阶段。您要先升级 RHOSP,然后升级操作系统。
- BZ#2026385
在这个版本中,您可以通过定义相应的隔离资源来配置使用
sbd
的fence_watchdog
,如通过 tripleo 的其他隔离设备:parameter_defaults: EnableFencing: true FencingConfig: devices: - agent: fence_watchdog host_mac: "52:54:00:74:f7:51"
作为 Operator,您必须启用
sbd
并设置 watchdog 超时:parameter_defaults: ExtraConfig: pacemaker::corosync::enable_sbd: true tripleo::fencing::watchdog_timeout: 20
- BZ#2033811
- 共享文件系统服务(manila)现在支持使用 Pure Storage Flashblade 系统作为后端。请参考红帽生态系统目录,找到供应商的认证和安装文档。
- BZ#2060758
- 在 Red Hat OpenStack Platform (RHOSP) 17.1 中,RHOSP 负载均衡服务(octavia)支持使用 Amphora 日志卸载的 TCP 协议的 rsyslog。有了这个增强,如果主服务器不可用,您可以将日志消息重定向到二级 rsyslog 服务器。如需更多信息,请参阅 Chapter 5。管理负载平衡服务实例日志 (将 负载均衡配置为服务 指南)。
- BZ#2066349
在这个版本中,由
overcloud-hardened-uefi-full.qcow2
整个磁盘 overcloud 镜像安装的 LVM 卷现在由一个精简池支持。卷仍然被增长为消耗可用的物理存储,但默认不会过度置备。精简配置的逻辑卷的好处:
- 如果卷填满容量,则人工干预的选项现在包括增大卷以过度置备物理存储容量。
- RHOSP 升级过程现在可以在精简置备环境中创建临时备份卷。
- BZ#2069624
- Red Hat OpenStack Platform (RHOSP)快照和恢复功能基于逻辑卷管理器(LVM)快照功能,旨在恢复升级或更新失败。在执行升级或更新前,快照会保留 RHOSP 集群的原始磁盘状态。然后,您可以删除或恢复快照,具体取决于结果。如果升级成功完成,且您不再需要快照,请将快照从节点中删除。如果升级失败,您可以恢复快照,评估任何错误,然后再次启动升级过程。恢复会使所有节点的磁盘与执行快照时完全相同。
- BZ#2074896
-
在以前的版本中,Open vSwitch (OVS)绑定
balance-tcp
模式仅在 RHOSP 中作为技术预览提供。由于 L4 哈希重新循环问题,不建议在生产环境中使用模式。这个问题已被解决,您可以使用 OVS 绑定balance-tcp
模式。您必须设置lb-output-action=true
以使用balance-tcp
模式。 - BZ#2086688
- RHOSP 17.1 GA 支持使用连接跟踪(conntrack)模块将 OpenFlow 流卸载到硬件。如需更多信息,请参阅配置网络功能虚拟化 中的 配置 OVS 硬件卸载组件。
- BZ#2097931
- 在 RHOSP 17.1 中,您可以实时迁移、取消和撤离使用具有资源请求的端口的实例,如保证最小带宽 QoS 策略。
- BZ#2104522
- 在这个版本中,实时迁移使用多选 Open Virtual Network (OVN)端口来优化迁移流程,并显著减少迁移过程中虚拟机的网络停机时间。
- BZ#2106406
此更新引入了脚本
neutron-remove-duplicated-port-bindings
,以修复有时会影响对失败实时迁移处理的问题。如果实时迁移失败,计算服务(Nova)将恢复迁移。迁移反向意味着删除数据库或目标计算节点上创建的任何对象。
然而,在一些情况下,实时迁移失败后端口会被保留,带有重复的端口绑定。
neutron-remove-duplicated-port-bindings
脚本查找重复的端口绑定,并删除不活跃的绑定。如果实时迁移失败,您可以运行脚本来产生重复的端口绑定。- BZ#2111528
- 在这个版本中,默认的 Ceph 容器镜像基于 Red Hat Ceph Storage 6 而不是 Red Hat Ceph Storage 5。
- BZ#2122209
-
在这个版本中,在 Validation Framework CLI 中添加了
验证文件
命令。此命令允许您按名称、组、类别和产品提供用于验证运行的文件。现在,您可以运行 'validation file <path_to_file>',并在以后为重新运行保留所选的验证。 - BZ#2124309
在这个版本中,Operator 可以为 Pacemaker 管理的虚拟 IP (VIP)启用 run_arping 功能,以便集群预先检查重复的 IP。
要做到这一点,您必须在环境文件中添加以下配置:
ExtraConfig: pacemaker::resource::ip::run_arping: true
如果找到重复项,则会在
/var/log/pacemaker/pacemaker.log
文件中记录以下错误:Sep 07 05:54:54 IPaddr2(ip-172.17.3.115)[209771]: ERROR: IPv4 address collision 172.17.3.115 [DAD] Sep 07 05:54:54 IPaddr2(ip-172.17.3.115)[209771]: ERROR: Failed to add 172.17.3.115
- BZ#2138238
- 在这个版本中,您将部署两个 Image 服务(glance) API 实例。OpenStack 租户可访问的实例配置为隐藏镜像位置详情,如镜像的直接 URL,或者镜像是否在多个位置中可用。第二个实例可供 OpenStack 管理员和 OpenStack 服务访问,如块存储服务(cinder)和计算服务(nova)。此实例配置为提供镜像位置详情。此功能增强解决了 OSSN-0090 和 CVE-2022-4134 的建议。在这个版本中,恶意用户无法利用镜像的位置详情来上传更改的镜像。
- BZ#2152877
- 此增强将 OVN 安全组日志记录添加到网络服务(neutron)中,以回复网络连接的数据包。ovn-controller 日志文件现在记录完整的网络连接。
- BZ#2165501
- 从 Red Hat OpenStack Platform (RHOSP) 17.1 开始,在 ML2/OVN 部署中,您可以为硬件卸载的端口启用最小带宽和带宽限制出口策略。您无法为硬件卸载的端口启用 ingress 策略。如需更多信息 ,请参阅为 QoS 策略配置网络服务。
- BZ#2187255
借助此次更新,您可以将项目和用户名字段添加到传出的数据收集服务(ceilometer)指标。在以前的版本中,云管理员必须依赖项目的 UUID 和用户来识别租户。现在,您可以查看项目和用户名的列表,而不是 UUID。
注意此功能不适用于 gnocchi 或 Service Telemetry Framework (STF)。
3.4.4. 技术预览
本节中列出的项目在此 Red Hat OpenStack Platform (RHOSP)发行版本中作为技术预览提供。有关技术预览状态范围的详情,以及相关的支持影响,请参阅 https://access.redhat.com/support/offerings/techpreview/。
- BZ#1813561
- 在这个版本中,负载均衡服务(octavia)使用应用程序层协议 Negotiation (ALPN)支持 HTTP/2 负载均衡,用于通过传输层安全(TLS)启用的监听程序和池。HTTP/2 协议通过更快地加载页面来提高性能。
- BZ#1848407
- 在 RHOSP 17.1 中,负载均衡服务(octavia)中的流控制传输协议(SCTP)提供了一个技术预览。用户可以在负载均衡器中创建 SCTP 侦听程序并附加 SCTP 池。
- BZ#2057921
- 在 RHOSP 17.1 中,提供了一个技术预览,用于通过 IPv6 管理网络创建负载均衡器。将私有 IPv6 管理网络用于负载均衡服务(octavia)可以简化边缘部署。
- BZ#2217663
- 在 RHOSP 17.1 中,VF-LAG 传输哈希策略卸载提供了一个技术预览,它允许在 NIC 硬件上进行负载均衡以卸载流量/流。这个哈希策略仅适用于 layer3+4 基础散列。
3.4.5. 发行注记
本节概述了本发行版本的重要信息,包括推荐做法和 Red Hat OpenStack Platform (RHOSP)的显著变化。您必须将此信息纳入考量,才能确保您的部署获得最佳效果。
- BZ#2072644
此功能增强允许用户从 RHOSP 16.2 升级到 RHOSP 17.1,并保持基于 Compute 节点上的基于 Red Hat Enterprise Linux (RHEL) 8 的操作系统,并与运行 RHEL 9 的节点相结合。
必须升级 control plane 节点和存储节点。默认行为是,除非有明确配置,否则所有节点都会升级到 RHEL 9。
- BZ#2081641
- 如果您使用运行 RHOSP 16.2.4 或更高版本的 Red Hat OpenStack Platform (RHOSP)环境,您可以直接升级到 RHOSP 17.1。
- BZ#2224523
在 RHOSP 联网环境中,在创建虚拟机实例时,请不要将实例绑定到虚拟端口 (vport)。反之,使用其 IP 地址不是另一个端口允许的地址对成员的端口。
将 vport 绑定到实例可防止实例生成并生成类似如下的错误消息:
WARNING nova.virt.libvirt.driver [req-XXXX - - - default default] [instance: XXXXXXXXX] Timeout waiting for [('network-vif-plugged', 'XXXXXXXXXX')] for instance with vm_state building and task_state spawning.: eventlet.timeout.Timeout: 300 seconds
3.4.6. 已知问题
目前,Red Hat OpenStack Platform (RHOSP)中存在这些已知问题:
- BZ#2108212
如果您在迁移到 OVN 机制驱动程序的过程中使用 IPv6 连接到实例,则当 ML2/OVS 服务停止时,与实例的连接可能会延迟到几分钟。要避免这种情况,请使用 IPv4。
在迁移到 OVN 机制驱动程序时,IPv6 的路由器广告守护进程
radvd
会停止。在停止radvd
时,路由器公告将不再广播。这个广播中断会导致实例连接在 IPv6 上丢失。新 ML2/OVN 服务启动后,会自动恢复 IPv6 通信。要避免潜在的中断,请使用 IPv4。
- BZ#2109597
- CX-5 有硬件(HW)限制。每个网络流量流在 HW 中有一个方向,可以是传输(TX)或接收(RX)。如果流的源端口是一个虚拟功能(VF),则它也是 HW 中的 TX 流。CX-5 无法在 TX 路径上弹出 VLAN,这可以防止将 pop_vlan 的流卸载到 HW。
- BZ#2109985
目前,在 ML2/OVS 部署中,Open vSwitch (OVS)不支持设置
skb_priority
、skb_mark
或输出队列字段的卸载 OpenFlow 规则。这些字段对于 virtio 端口的服务质量(QoS)支持是必需的。如果您为 virtio 端口设置了最小带宽规则,则 Networking 服务(neutron) OVS 代理使用 Packet Mark 字段标记此端口的流量。此流量无法卸载,它会影响其他端口中的流量。如果您设置了带宽限制规则,则所有流量都标记为默认的 0 队列,这意味着无法卸载任何流量。
临时解决方案:如果您的环境包含 OVS 硬件卸载端口,请在需要硬件卸载的节点中禁用数据包标记。当您禁用数据包标记时,无法为 virtio 端口设置速率限制规则。但是,区分服务代码点(DSCP)标记规则仍然可用。
在配置文件中,将
disable_packet_marking
标志设置为true
。编辑配置文件时,您必须重启neutron_ovs_agent
容器。例如:$ cat `/var/lib/config-data/puppet-generated/neutron/etc/neutron/plugins/ml2/openvswitch_agent.ini` [ovs] disable_packet_marking=True
- BZ#2126725
- 硬编码的证书位置独立于用户提供的值运行。在带有自定义证书位置的部署期间,服务不会从 API 端点检索信息,因为传输层安全(TLS)验证失败。
- BZ#2143874
在 RHOSP 17.1 中,当部署 DNS 服务(designate)时,当 overcloud 被删除时,在 undercloud 上创建的网络服务(neutron)端口不会被删除。当 overcloud 使用 DNS 服务重新创建或不使用 DNS 服务时,这些端口不会造成操作问题。
临时解决方案:删除 overcloud 后,使用
openstack port delete
命令手动删除端口。- BZ#2144492
- 如果您将带有分布式虚拟路由(DVR)的 RHOSP 17.1.0 ML2/OVS 部署迁移到 ML2/OVN,则 ML2/OVN 迁移过程中发生的浮动 IP (FIP)停机时间可能会超过 60 秒。
- BZ#2160481
在使用 BGP 动态路由的 RHOSP 17.1 环境中,目前存在一个已知问题:浮动 IP (FIP)端口转发失败。
配置 FIP 端口转发时,发送到带有与 FIP 相等的目标 IP 的特定目标端口的数据包将从 RHOSP 网络服务(neutron)端口重定向到内部 IP。无论使用的协议是什么,都会出现这种情况:TCP、UDP 等。
配置 BGP 动态路由时,不公开执行 FIP 端口转发的路由,这些数据包无法访问其最终目的地。
目前,还没有临时解决方案。
- BZ#2163477
- 在使用 BGP 动态路由的 RHOSP 17.1 环境中,目前存在一个已知问题影响到提供商网络的实例。RHOSP 计算服务无法将从其中一个实例发送到多播 IP 地址目的地的数据包。因此,订阅多播组的实例无法接收发送到它们的数据包。其原因是 overcloud 节点上没有正确配置 BGP 多播路由。目前,还没有临时解决方案。
- BZ#2167428
- 在新部署期间,当 agent-notification 服务初始化时,keystone 服务通常不可用。这可防止 ceilometer 发现 gnocchi 端点。因此,指标不会发送到 gnocchi。
- BZ#2178500
- 如果在使用 nova-manage CLI 时卷刷新失败,这会导致实例保持锁定状态。
- BZ#2180542
Pacemaker 控制的
ceph-nfs
资源需要一个运行时目录来存储某些进程数据。安装或升级 RHOSP 时会创建该目录。目前,重启 Controller 节点会删除目录,在 Controller 节点重启时不会恢复ceph-nfs
服务。如果所有 Controller 节点都已重启,ceph-nfs
服务会永久失败。临时解决方案:如果重启 Controller 节点,登录到 Controller 节点并创建
/var/run/ceph
目录:$ mkdir -p /var/run/ceph
在所有已重新引导的 Controller 节点上重复此步骤。如果在创建目录后
ceph-nfs-pacemaker
服务已标记为失败,请从任何 Controller 节点执行以下命令:$ pcs resource cleanup
- BZ#2180883
目前,Logrotate 归档一次所有日志文件,Rsyslog 会停止将日志发送到 Elasticsearch Workaround:在部署期间将 "RsyslogReopenOnTruncate: true" 添加到环境文件,以便 Rsyslog 重新打开日志轮转时的所有日志文件。
目前,RHOSP 17.1 使用了一个旧的 puppet-rsyslog 模块,它配置了一个不正确的 Rsyslog。临时解决方案:在部署 rsyslog 之前,在
/usr/share/openstack-tripleo-heat-templates/deployment/logging/rsyslog-container-puppet.yaml
中手动应用补丁 [1]。- BZ#2182371
目前,使用 Mellanox ConnectX-5、ConnectX-6 和 Bluefield-2 NIC 的客户机实例存在一个已知问题,以及带有卸载(switchdev)端口的 Bluefield-2 NIC。当您直接从客户机重启操作系统时,需要很长时间来初始化系统,例如,使用
sudo systemctl reboot --reboot-arg=now
。如果实例配置了来自同一物理功能(PF)的两个虚拟功能(VF),则其中一个 VF 的初始化可能会失败,并导致较长的初始化时间。临时解决方案:使用 OpenStack API 及时重启客户机实例,而不是直接重启客户机实例。
- BZ#2183793
在使用以下 BIOS 配置时,对于 RHOSP 17.1 上 UEFI 引导模式的某些 AMD 平台上的 NFV 部署,overcloud 节点置备可能会失败:
- 引导模式:UEFI
hard-disk Drive Placeholder: Enabled
临时解决方案:将
Hard-disk Drive Placeholder
设置为Disabled
。有关如何在 UEFI 引导模式的 AMD 平台上评估 NFV 部署的每个 BIOS 属性的详情,请参考您的硬件参考指南。
- BZ#2184834
-
Block Storage API 支持通过在 volume-create 请求中传递参数来创建块存储多附加卷,即使此方法创建了 multi-attach 卷已被移除,因为它不安全,因为它在不支持 multi-attach 卷的后端上创建多附件卷时可能会导致数据丢失。临时解决方案:使用 multi-attach 卷类型创建一个多附件卷,这是创建
openstack
和cinder
CLI 提供的多附件卷的唯一方法。 - BZ#2185897
- 在 ML2/OVN 部署中,不要对使用中继端口的实例使用实时迁移。在使用中继端口的实例上,实时迁移可能会因为 Compute 节点之间实例子端口进行流动而失败。对于具有中继端口的实例,请使用冷迁移。
- BZ#2192913
在启用了 DVR 的 ML2/OVN 或 ML2/OVS 的 RHOSP 环境中,连接到不同租户网络的实例之间的 east/west 流量会产生大量到光纤。
因此,这些实例之间的数据包不仅到达运行这些实例的 Compute 节点,还到达任何其他 overcloud 节点。
这可能导致对网络的影响,这可能是安全风险,因为光纤在任何位置发送流量。
这个错误将在 FDP 以后的发行版本中解决。您不需要执行 RHOSP 更新来获取 FDP 修复。
- BZ#2193388
Dashboard 服务(horizon)目前被配置为默认验证客户端 TLS 证书,这会在所有 TLS 随处(TLS-e)部署中中断 Dashboard 服务。
临时解决方案:
在环境文件中添加以下配置:
parameter_defaults: ControllerExtraConfig: horizon::ssl_verify_client: none
使用其他环境文件将环境文件添加到堆栈中,并部署 overcloud:
(undercloud)$ openstack overcloud deploy --templates \ -e [your environment files] \ -e /home/stack/templates/<environment_file>.yaml
- BZ#2196291
- 目前,自定义 SRBAC 规则不允许非管理员用户列出策略规则。因此,非管理员用户无法列出或管理这些规则。目前的解决方法包括禁用 SRBAC,或修改 SRBAC 自定义规则以允许此操作。
- BZ#2203785
-
目前,有一个权限问题,导致 collectd sensubility 在重启一个裸机节点后停止工作。因此,sensubility 会停止报告容器健康状况。临时解决方案:重新引导 overcloud 节点后,在节点上手动运行以下命令:
sudo podman exec -it collectd setfacl -R -m u:collectd:rwx /run/podman
- BZ#2203857
- Red Hat Ceph Storage (RHCS) 6.0 中的 Ceph RADOS 网关组件中的一个已知问题会导致使用 Identity 服务(keystone)令牌授权失败。这个问题不是 RHCS 6.1 中的清单,在 RHOSP 17.1 中被支持。
- BZ#2210030
- 目前存在一个已知问题:自定义 SRBAC 规则不允许将共享安全组列出不是规则所有者的非管理员用户。这会导致共享安全组和规则没有被不是规则所有者的非管理员用户正确管理。临时解决方案:禁用自定义 SRBAC 规则或修改自定义规则,以允许任何用户管理规则。
- BZ#2210319
目前,RHEL 9.2 中的 Retbleed 漏洞缓解可能会导致 Intel Skylake CPU 上使用 Data Plane Development Kit (OVS-DPDK)的 Open vSwitch 的性能下降。
只有在 BIOS 中禁用了 C-states,超线程被启用,OVS-DPDK 只使用一个给定内核的超线程时,才会发生此性能回归。
临时解决方案:将核心的超线程分配给 OVS-DPDK 或将运行 DPDK 的 SRIOV 客户机(如 NFV 配置指南中的推荐)。
- BZ#2213126
缓冲区超过安全组日志条目的日志队列有时会在达到指定限制前停止接受条目。作为临时解决方案,您可以设置超过您要保存的条目数的队列长度。
您可以使用参数
NeutronOVNLoggingRateLimit
设置每秒的最大日志条目数。如果日志条目创建超过那个速率,则过量在队列中会被缓冲到您在NeutronOVNLoggingBurstLimit
中指定的日志条目数。这个问题在突发的第一秒中尤其明显。在较长的突发(如 60 秒)中,速率限值更大,并补偿突发限制。因此,这个问题在短的突发中具有最大比例的影响。
临时解决方案:在比目标值高的值设置
NeutronOVNLoggingBurstLimit
。根据需要观察和调整。- BZ#2215053
-
在使用 Border Gateway Protocol (BGP)动态路由的 RHOSP 17.1 环境中,目前存在一个已知问题: FRRouting (FRR)容器无法部署。发生这种情况的原因是,RHOSP director 在容器镜像准备任务完成前部署 FRR 容器。临时解决方案:在 heat 模板中,确保
ContainerImagePrepare
在overcloud deploy
命令前面。 - BZ#2216021
带有 OVN 机制驱动程序的 RHOSP 17.1 不支持记录每个端口的流事件,或使用
网络日志 create
命令的--target
选项。RHOSP 17.1 支持使用
network log create
命令的--resource
选项为每个安全组记录流事件。请参阅配置 Red Hat OpenStack Platform 网络 中的"Logging 安全组操作"。- BZ#2217867
- 目前在使用硬件卸载时,Nvidia ConnectX-5 和 ConnectX-6 NIC 有一个已知问题,其中 PF 上的一些卸载流可能会导致关联的 VF 上的临时性能问题。此问题通过 LLDP 和 VRRP 流量特别观察到。
- BZ#2219574
- 数据收集服务(ceilometer)不提供默认的缓存后端,这可能会导致某些服务在轮询指标时超载。
- BZ#2219603
在 RHOSP 17.1 GA 中,当启用了安全基于角色的访问控制(sRBAC)时,DNS 服务(designate)会被错误配置。当前的 sRBAC 策略包含指定不正确的规则,且必须修正指定才能正常工作。
临时解决方案:在 undercloud 服务器上应用以下补丁并重新部署 overcloud:
https://review.opendev.org/c/openstack/tripleo-heat-templates/+/888159
- BZ#2219830
在 RHOSP 17.1 中,有临时数据包丢失的问题,其中硬件中断请求(IRQ)会在 OVS-DPDK PMD 线程或运行 DPDK 应用程序的客户机上出现非自愿上下文切换。
此问题是在部署过程中置备大量 VF 的结果。VF 需要 IRQ,每个必须绑定到物理 CPU。当没有足够的内务 CPU 处理 IRQ 的容量时,
irqbalance
无法绑定所有它们,而 IRQ 在隔离的 CPU 上进行绑定。临时解决方案:您可以尝试一个或多个这些操作:
- 减少置备的 VF 数量,以避免将未使用的 VF 保持绑定到其默认 Linux 驱动程序。
- 增加内务 CPU 的数量,以处理所有 IRQ。
- 强制关闭未使用的 VF 网络接口,以避免 IRQ 中断隔离的 CPU。
- 禁用未使用、VF 网络接口上的多播和广播流量,以避免 IRQ 中断隔离的 CPU。
- BZ#2220808
-
在 RHOSP 17.1 中,数据收集服务(ceilometer)不报告 airflow 指标存在一个已知问题。这是因为数据收集服务缺少 gnocchi 资源类型
hardware.ipmi.fan
。目前,还没有临时解决方案。 - BZ#2220887
- 数据收集服务(ceilometer)不会过滤单独的电源和当前指标。
- BZ#2222543
目前,当替换 bootstrap Controller 节点时,OVN 数据库集群会被分区: 北向和南向数据库有两个数据库集群。这种情形使得实例变得不可用。
要查找 bootstrap Controller 节点的名称,请运行以下命令:
ssh tripleo-admin@CONTROLLER_IP "sudo hiera -c /etc/puppet/hiera.yaml pacemaker_short_bootstrap_node_name"
临时解决方案:执行 Red Hat KCS 解决方案 7024434: 恢复分区集群的 OVN 数据库 中所述的步骤。
- BZ#2222589
- 目前,从 RHOSP 16.2 升级到 17.1 存在一个已知问题,director 升级脚本会在使用 IPv6 的 director 部署的 Ceph Storage 环境中将 Red Hat Ceph Storage 4 升级到 5 时停止执行。临时解决方案:在使用 IPv6 的 director 部署的环境中升级 RHCS 时,Red Hat KCS 解决方案 7027594: Director 升级脚本会在 RHOSP 升级过程中停止。
- BZ#2222605
- 在 RHOSP 17.1 中,安全组日志条目存在一个已知问题。当事件出现较短的间隔时,相关的安全组日志条目会按照不正确的顺序列出。这是因为 OVN 后端进程事件的方式所致。目前,还没有临时解决方案。
- BZ#2222683
目前,以下部署架构不支持 Multi-RHEL:
- Edge (DCN)
- ShiftOnStack
基于 director 的 director 部署
临时解决方案:在运行列出的构架之一时,在 RHOSP 部署中只使用一个 RHEL 版本。
- BZ#2223294
当执行从 RHOSP 16.2 升级到 17.1 GA 时,存在一个已知问题。集合代理
collectd-sensubility
无法在 RHEL 8 Compute 节点上运行。临时解决方案:在受影响的节点上编辑文件,
/var/lib/container-config-scripts/collectd_check_health.py
,并将第 26 行的"healthy: .State.Health.Status}"
替换为"healthy: .State.Healthcheck.Status}"/
。- BZ#2223916
在使用 ML2/OVN 机制驱动程序的 RHOSP 17.1 GA 环境中,浮动 IP 端口转发无法正常工作。造成这个问题的原因是,当使用 FIP 时 VLAN 和扁平网络分发南北网络流量,而是应在 Controller 或 Networker 节点上集中 FIP 端口转发。
临时解决方案: 要通过集中式网关节点解决这个问题并强制 FIP 端口转发,可将 RHOSP 编排服务(heat)参数
NeutronEnableDVR
设置为false
,或者使用 Geneve 而不是 VLAN 或扁平项目网络。- BZ#2224236
在这个 RHOSP 发行版本中,存在一个已知问题:使用 Intel X710 和 E810 系列控制器虚拟功能(VF)的 SR-IOV 接口可能会遇到涉及链接状态流的网络连接问题。受影响的客户机内核版本有:
-
RHEL 8.7.0
8.7.3 (计划没有修复)。生命周期结束。) -
RHEL 8.8.0
8.8.2 (在 8.8.3 版本中计划使用Fix) -
RHEL 9.2.0
9.2.2 (版本 9.2.3 中计划使用Fix) 上游 Linux 4.9.0
6.4 65534 (在 6.5. 中计划使用Fix) 临时解决方案:除了使用未影响的客户机内核外,还有其他问题。
-
RHEL 8.7.0
- BZ#2224527
- 目前,当 RADOS 网关(RGW)部署为 director 部署的 Red Hat Ceph Storage 的一部分时,从 RHOSP 16.2 升级到 17.1 存在一个已知问题。当 HAProxy 在下次堆栈更新时,这个过程会失败。临时解决方案:从 Red Hat KCS 解决方案 7025985 应用临时解决方案:当 RHCS 部署且启用了 RGW 时,HAProxy 不会在 RHOSP 升级过程中重启
- BZ#2225205
-
过时的升级编配逻辑会在快速转发升级(FFU)过程中覆盖现有的 pacemaker 身份验证密钥,防止 Pacemaker 在实例 HA 被启用时连接到 Compute 节点上运行的
pacemaker_remote
。因此,在 Compute 节点上运行的升级会失败,且从中央集群无法访问 Compute 节点上运行的pacemaker_remote
。如果配置了 Instance HA,请联系红帽支持,以接收有关如何执行 FFU 的说明。 - BZ#2226366
目前,在为卷使用 Red Hat Ceph Storage (RHCS)后端时存在一个已知问题,这可能会阻止实例重启,并可能导致数据崩溃。当满足以下条件时会出现这种情况:
- RHCS 是实例卷的后端。
- RHCS 有多个用于卷的存储池。
- 一个卷被重新输入,新类型需要存储在与当前位置不同的池中。
-
retype 调用使用
on-demand
migration_policy。 - 卷已连接到实例。
临时解决方案:不要
重新输入
满足所有列出条件的卷。- BZ#2227360
- NetApp NFS 驱动程序的镜像缓存清理任务可能会导致其他块存储服务中无法预计的性能下降。当前没有解决此问题的方法。
- BZ#2229750
- 当您在创建块存储卷备份时指定可用区(AZ)时,AZ 将被忽略。如果您的 AZ 配置阻止调度程序满足备份请求,这可能会导致备份失败。此问题不会影响从现有备份创建卷的跨可用区。
- BZ#2229761
-
目前,在
ovn_controller
和ovn_dbs
的部署步骤中存在一个竞争条件,这会导致ovn_dbs
在ovn_controller
前升级。如果在ovn_dbs
之前没有升级ovn_controller
,则重启到新版本时出错会导致数据包丢失。如果在 Open Virtual Network (OVN)升级过程中发生竞争条件,预计会出现一分钟网络中断。后续 RHOSP 发行版本中会进行修复。 - BZ#2229767
-
目前,当您从 RHOSP 16.2 升级到 17.1 时,将 Red Hat Ceph Storage 4 升级到 5 时存在一个已知问题。
ceph-nfs
资源配置错误,Pacemaker 不管理该资源。overcloud 升级失败,因为与ceph-nfs-pacemaker
关联的容器停机,会影响共享文件系统服务(manila)。RHOSP 17.1.1. 中应该有一个修复。临时解决方案:应用 Red Hat KCS 解决方案 7028073 中的临时解决方案: Pacemaker 在 RHOSP 和 RHCS 升级过程中无法正确管理ceph-nfs
资源。 - BZ#2229937
-
当
collectd sensubility
无法创建发送者时,它不会关闭到发送者的链接。长时间运行的、失败的开放链接可能会导致总线出现问题,这会导致collectd sensubility
停止工作。临时解决方案:重启受影响 overcloud 节点上的collectd
容器,以恢复collectd sensubility
。 - BZ#2231378
- 如果您选择 Red Hat Ceph Storage 作为 Block Storage (cinder)备份服务存储库的后端,则您只能将备份卷恢复到基于 RBD 的块存储后端。目前还没有临时解决方案。
- BZ#2231893
元数据服务在多个尝试启动 HAProxy 子容器失败时,元数据服务可能会不可用。元数据代理记录类似:"ProcessExecutionError: Exit code: 125; Stdin: ; Stdout: Starting a new child container neutron-haproxy-ovnmeta-<uuid>" 的错误消息。
临时解决方案:运行
podman kill <_container name_>
以停止有问题的 haproxy 子容器。- BZ#2231960
- 当块存储卷使用 Red Hat Ceph Storage 后端时,当从这个卷创建快照时,无法删除卷,然后从此快照中创建卷克隆。在这种情况下,当卷克隆存在时,您无法删除原始卷。
- BZ#2232171
如果您在其可用性的前几天下载 RHOSP 17.1.0 GA,您可能会发现文件 /etc/rhosp/release 中的版本描述错误地包含 Beta 设计,如下例所示。
(overcloud) [stack@undercloud-0 ~]$ cat /etc/rhosp-release Red Hat OpenStack Platform release 17.1.0 Beta (Wallaby)
临时解决方案:如果您的 GA 部署会受到影响,请运行以下命令:!
dnf -y update rhosp-release
- BZ#2232199
如果您在其可用性的前几天下载 RHOSP 17.1.0 GA,您可能会发现文件 /etc/rhosp/release 中的版本描述错误地包含 Beta 设计,如下例所示。
(overcloud) [stack@undercloud-0 ~]$ cat /etc/rhosp-release Red Hat OpenStack Platform release 17.1.0 Beta (Ussri)
临时解决方案:如果您的 GA 部署会受到影响,请运行以下命令:!
dnf -y update rhosp-release
- BZ#2233487
- 在使用 RHOSP 动态路由的 RHOSP 17.1 GA 环境中,存在一个已知问题:使用带有 OVN 供应商驱动程序的 RHOSP 负载均衡服务创建负载均衡器可能会失败。当控制器节点之间存在延迟时,可能会出现此故障。没有临时解决方案。
3.4.7. 过时的功能
本节中的项目可能不再被支持,或者在以后的 Red Hat OpenStack Platform (RHOSP)发行版本中不再支持。
- BZ#2128701
从 RHOSP 17.0 开始,ML2/OVS 机制驱动程序已弃用。
在多个版本中,红帽将 ML2/OVS 替换为 ML2/OVN。例如,从 RHOSP 15 开始,ML2/OVN 成为默认机制驱动程序。
通过 RHOSP 17 发行版本,支持已弃用的 ML2/OVS 机制驱动程序。在此期间,ML2/OVS 驱动程序保持维护模式,接收程序错误修复和正常支持,大多数新的功能开发都会在 ML2/OVN 机制驱动程序中发生。
在 RHOSP 18.0 中,红帽计划完全删除 ML2/OVS 机制驱动程序并停止支持它。
如果您的现有 RHOSP 部署使用 ML2/OVS 机制驱动程序,请立即开始评估迁移到机制驱动程序的计划。RHOSP 16.2 和 17.1 支持迁移。
红帽需要在尝试从 ML2/OVS 迁移到 ML2/OVN 前提交主动支持问题单。红帽不支持在没有主动支持问题单的情况下进行迁移。请参见 如何在 Red Hat OpenStack Platform 上为计划的活动创建一个主动问题单?
- BZ#2136445
使用 sensubility 通过 podman 监控 API 健康状态在 RHOSP 17.1 中已被弃用。
只有 sensubility 层已弃用。API 健康检查仍处于支持状态。sensubility 层存在与 Sensu 交互,它不再是一个受支持的接口。
- BZ#2139931
- metrics_qdr 服务(AMQ Interconnect)在 RHOSP 17.1 中弃用。对于到 Service Telemetry Framework (STF)的数据传输,RHOSP 17.1 中继续支持 metrics_qdr 服务。metrics_qdr 服务用作 STF 的数据传输,不会影响 Red Hat OpenStack 操作的任何其他组件。
- BZ#2179428
- 在 active-passive 配置中部署 Block Storage (cinder)备份服务在 RHOSP 17.1 中已弃用,并将在以后的发行版本中删除。对于 RHOSP 16.2 和 RHOSP 17.0,块存储(cinder)备份服务部署在主动 - 被动配置中,此配置将继续在这些升级的集群的 RHOSP 17.1 中被支持。
- BZ#2215264
- 在 RHOSP 17.1 中弃用了验证框架(VF)。
- BZ#2238425
- collectd 在 RHOSP 17.1 中已弃用。
3.4.8. 删除的功能
本节中的项目在此 Red Hat OpenStack Platform (RHOSP)发行版本中删除:
- BZ#2065541
- 在 RHOSP 17.1 中,collectd-gnocchi 插件已从 director 中删除。您可以使用 Service Telemetry Framework (STF)来收集监控数据。