3.2. 发行信息 RHOSO 18.0.3
3.2.1. 公告列表
此 Red Hat OpenStack Services on OpenShift (RHOSO)发行版本包括以下公告:
- RHBA-2024:9480
- RHOSO 18.0.3 组件发布(功能版本 1)
- RHSA-2024:9481
- 中度:Red Hat OpenStack Platform 18.0.3 (python-django)安全更新
- RHBA-2024:9482
- RHOSO 18.0.3 的容器发布(功能版本 1)
- RHBA-2024:9483
- RHOSO 18.0.3 的数据平面 Operator (功能版本 1)
- RHBA-2024:9484
- RHOSO 18.0.3 的操作器发布(功能版本 1)
- RHSA-2024:9485
- 重要:RHOSO 18.0.3 的 control plane Operator (功能版本 1)安全更新
- RHBA-2024:9486
- RHOSO 18.0.3 的 control plane Operator (功能版本 1)
3.2.2. Observability(可观察性)
3.2.2.1. 新功能
这部分描述了 OpenShift 18.0 上的 Red Hat OpenStack Services 中引入的新功能和主要改进。
现在,在 Prometheus 中,RabbitMQ 指标.
在这个版本中,RabbitMQ 指标会收集并存储在 Prometheus 中。添加了用于显示这些指标的新仪表板。
自动扩展改进
自动扩展已更新,以使用 server_group 元数据。这提高了自动扩展功能的稳定性。如需更多信息,请参阅实例的自动扩展
3.2.2.2. 技术预览
这部分列出了 OpenShift 18.0 上的 Red Hat OpenStack Services 中的所有技术预览。
有关技术预览功能支持范围的信息,请参阅技术预览功能支持范围 - 支持范围。
VM 电源使用监控(技术预览)
通过集成 kepler 组件,您可以在仪表板中公开虚拟机实例的功耗。
3.2.3. Compute
3.2.3.1. 新功能
这部分描述了 OpenShift 18.0 上的 Red Hat OpenStack Services 中引入的新功能和主要改进。
vGPU 启用
这个版本引进了对 mdev 和 vGPU 的增强。
3.2.3.2. 程序错误修复
这部分论述了 Red Hat OpenStack Services on OpenShift 18.0 中修复的、对用户有严重影响的错误。
NUMA 资源跟踪正常工作
在这个版本中,解决了会导致 NUMA 资源跟踪问题的错误。在以前的版本中,Libvirt 在 NUMA 节点 0 上报告所有关闭的 CPU,而不是在正确的 NUMA 节点上报告。现在,Nova 会在关闭任何 CPU 前缓存正确的 CPU 拓扑,以修复资源跟踪问题。
3.2.3.3. 已知问题
这部分论述了 Red Hat OpenStack Services on OpenShift 18.0 中已知的问题。
在镜像服务(glance)镜像上设置 hw-
或架构无法正常工作architecture
在 RHOSO 18.0 中,镜像元数据 prefilter 默认启用。RHOSO 不支持非原生架构的模拟。作为引入上游模拟支持上游的一部分,镜像元数据 prefilter 被改进,以支持根据声明的虚拟机架构调度实例,如 hw_architecture=x86_64
。
当 nova 被改进为通过镜像属性模拟非原生架构时,会引入一个程序错误,因为原生架构没有报告为 virt 驱动程序的特征。
因此,默认情况下,对在镜像上设置 hw_
或架构的支持是无法正常运行的。
architecture
临时解决方案: 要缓解这个程序错误,请执行以下任务之一:
-
取消设置
architecture
/hw_architecture
镜像属性。RHOSO 只支持一个架构 x86_64。没有需要为 RHOSO 云设置它的有效用例,因此所有主机都将是 x86_64。 在 nova 调度程序的
CustomServiceConfig
部分中禁用镜像元数据 prefilter :[scheduler] image_metadata_prefilter=false
在计算服务重启后,NFS 共享上具有临时存储的实例停止工作
当容器化 Compute 代理服务在虚拟机监控程序主机上重新启动时,NFS 共享上的具有临时存储的计算服务(nova)实例停止工作。这是因为 /var/lib/nova/instances 的权限改变。
临时解决方案: 手动恢复权限到原始值并避免服务重启。
默认禁用计算服务电源管理功能
默认情况下,计算服务(nova)电源管理功能被禁用。您可以使用以下 nova-compute
配置启用它:
[libvirt] cpu_power_management = true cpu_power_management_strategy = governor
目前不支持默认的 cpu_power_management_strategy
cpu_state
。重启 nova-compute 会导致在该主机上所有专用 PCPU 停机,包括实例所使用的 PCPU。如果使用 cpu_state
策略,则这些实例的 CPU 将变为 unpinned。
3.2.4. 数据平面
3.2.4.1. 新功能
这部分描述了 OpenShift 18.0 上的 Red Hat OpenStack Services 中引入的新功能和主要改进。
OpenStackAnsibleEE 自定义资源替代 openstack-operator 中的功能
功能增强:OpenStackAnsibleEE 自定义资源已与 openstack-ansibleee-operator 一起删除。此功能已集成到 openstack-operator 中,以允许直接创建 Kubernetes 作业,而无需额外的 operator 和关联的自定义资源提供不必要的抽象。
原因:不需要额外的抽象。这一更改减少了需要维护的代码数量,并减少集群中运行的 CRD 和 Operator 的数量。
结果:用户可以预期在部署 dataplane 节点时不再会创建任何 OpenStackAnsibleEE 资源。相反,它们只会看到 Kubernetes 作业。
现有 OpenStackAnsibleEE 资源将保留在集群中,或者如果用户不再需要他们进行历史参考,可以删除这些资源。提供了相应的文档来清理不必要的资源和运算符。
3.2.5. 网络
3.2.5.1. 新功能
这部分描述了 OpenShift 18.0 上的 Red Hat OpenStack Services 中引入的新功能和主要改进。
使用 FRR 和 BGP 的数据平面上的动态路由
在这个版本中,增加了对自由范围路由(FRR)边框网关协议(BGP)的支持,以在 RHOSO 数据平面上提供动态路由功能。
限制:
- 如果使用动态路由,还必须使用分布式虚拟路由(DVR)。
- 如果使用动态路由,也使用专用的 networker 节点。
- 您不能在 IPv6 部署中使用动态路由,或使用负载均衡服务(octavia)的部署。
3.2.5.2. 技术预览
这部分列出了 OpenShift 18.0 上的 Red Hat OpenStack Services 中的所有技术预览。
有关技术预览功能支持范围的信息,请参阅技术预览功能支持范围 - 支持范围。
自定义 ML2 机制驱动程序和 SDN 后端支持(技术预览)
这个版本引入了一个技术预览,它可将网络服务(neutron)与自定义 ML2 机制驱动程序和软件定义的网络(SDN)后端组件集成,而不是默认的 OVN 机制驱动程序和后端组件。
3.2.5.3. 已知问题
这部分论述了 Red Hat OpenStack Services on OpenShift 18.0 中已知的问题。
在采用前更新至最新的 RHOSP 17.1 版本
在对比 RHOSP 17.1.4 旧的源环境执行源环境时,工作负载会延长网络连接中断。在采用前,请确保至少将源环境更新至 RHOSP 17.1.4。
Octavia-operator 不启用反关联性
负载均衡服务(octavia)目前没有在 Nova 中配置反关联性设置,以防止将 amphora 虚拟机调度到同一计算节点。
临时解决方案: 通过 customConfig 将相关设置添加到 octavia 中,如下例所示:
Example
# names will be dependent on the deployment oc patch -n openstack openstackcontrolplane openstack-galera-network-isolation --type=merge --patch ' spec: octavia: template: octaviaHousekeeping: customServiceConfig: | [nova] enable_anti_affinity = true octaviaWorker: customServiceConfig: | [nova] enable_anti_affinity = true octaviaHealthManager: customServiceConfig: | [nova] enable_anti_affinity = true '
networker 节点上的负载均衡服务(octavia)代理不支持使用
目前不支持使用在 networker 节点上部署的负载均衡服务代理的部署。
在定义可用区时,createDefaultLbMgmtNetwork
和 manageLbMgmtNetworks
被设置为 false
当在 Octavia CR 中设置可用区列表(在 spec.lbMgmtNetwork.availabilityZones
中)时,spec.lbMgmtNetwork.createDefaultLbMgmtNetwork
和 spec.lbMgmtNetwork.manageLbMgmtNetworks
设置的默认值会错误地重置为 false
。
临时解决方案: 当将 availabilityZones
设置为 spec.lbMgmtNetwork
中的非空列表时,明确设置 createDefaultLbMgmtNetwork
,并将 manageLbMgmtNetworks 设置为 'true
。
未验证组合 Controller/Networker 节点的使用
红帽还没有验证使用 RHOSP 17.1 环境的过程,其中 Controller 和 Networker 角色在 Controller 节点上组成。如果您的 RHOSP 17.1 环境使用 Controller 节点上的 Controller/Networker 角色,则记录的采用过程不会产生预期的结果。
已验证使用专用网络器节点的 RHOSP 17.1 环境已验证可以正常工作。
采用后旧的 tripleo Networking services (neutron)
在 edpm_tripleo_cleanup 任务后,仍有传统的 tripleo Networking 服务(neutron)服务。这些服务在采用后停止,因此 RHOSO 服务不受影响。
临时解决方案: 执行以下步骤来手动删除旧服务:
- Check tripleo neutron services list: systemctl list-unit-files --type service - Remove tripleo services from: /etc/systemd/system/
3.2.6. 网络功能虚拟化
3.2.6.1. 已知问题
这部分论述了 Red Hat OpenStack Services on OpenShift 18.0 中已知的问题。
不要将虚拟功能(VF)用于 RHOSO control plane 接口
这个 RHOSO 发行版本不支持对 RHOSO control plane 接口使用 VF。
验证任何生产环境部署的 os-net-config
供应商 'ifcfg'
红帽目前不支持 NMstate
作为 os-net-config 供应商
。
确保设置了 edpm_network_config_nmstate: false
,这是默认设置。这样可确保您的环境使用 ifcfg
供应商。
3.2.7. Control plane(控制平面)
3.2.7.1. 已知问题
这部分论述了 Red Hat OpenStack Services on OpenShift 18.0 中已知的问题。
control plane 在次版本更新过程中临时不可用
在次发行版本 18.0 功能发行版本 1 中,Red Hat OpenStack Platform control plane 会临时不可用。API 请求可能会失败并显示 HTTP 错误代码,如错误 500。或者,API 请求可能会成功,但底层生命周期操作会失败。例如,在次要更新期间使用 openstack server create
命令创建的虚拟机(VM)永远不会达到 ACTIVE
状态。control plane 中断是临时的,并在次要更新完成后自动恢复。control plane 中断不会影响已在运行的工作负载。
3.2.8. 高可用性
3.2.8.1. 技术预览
这部分列出了 OpenShift 18.0 上的 Red Hat OpenStack Services 中的所有技术预览。
有关技术预览功能支持范围的信息,请参阅技术预览功能支持范围 - 支持范围。
实例高可用性
RHOSO 18.0.3 (功能版本 1)引入了实例高可用性(实例 HA)的技术预览。通过实例 HA,RHOSO 可以在 Compute 节点出现故障时自动撤离和重新创建不同 Compute 节点上的实例。
要在测试环境中使用实例 HA 技术预览,请参阅 https://access.redhat.com/articles/7094761。
不要在生产环境中使用此技术预览。
3.2.8.2. 已知问题
这部分论述了 Red Hat OpenStack Services on OpenShift 18.0 中已知的问题。
采用前可能的数据库错误
如果在使用 OSP 数据库之前运行 mysqlcheck
,则系统表 mysql.proc
可能会出现数据库错误。
[...] mysql.plugin OK mysql.proc Needs upgrade mysql.procs_priv OK [...]
这个错误消息是无害的,在 galera 集群启动时没有正确地复制的系统表的红色日志的结果。
临时解决方案: 您可以通过修复 mysql.proc
系统表来删除错误:
示例命令
oc run mariadb-client ${MARIADB_CLIENT_ANNOTATIONS} -q --image ${MARIADB_IMAGE} -i --rm --restart=Never -- \ mysql -h $SOURCE_MARIADB_IP -u root -p"$SOURCE_DB_ROOT_PASSWORD" -e "repair table mysql.proc;"
输出示例
+------------+--------+----------+---------------------------------+ | Table | Op | Msg_type | Msg_text | +------------+--------+----------+---------------------------------+ | mysql.proc | repair | info | Running zerofill on moved table | | mysql.proc | repair | status | OK | +------------+--------+----------+---------------------------------+
表及其红色日志已修复,并在所有 galera 节点上复制。重新运行 mysqlcheck 并继续采用过程。
3.2.9. Storage
3.2.9.1. 新功能
这部分描述了 OpenShift 18.0 上的 Red Hat OpenStack Services 中引入的新功能和主要改进。
停用 manilaShare
后端
现在,您可以从 RHOSO 中弃用 manilaShare
后端。当您删除 manila-share
时,清理作业会运行清理共享文件系统服务(manila)的服务列表。openstack share pool list
命令的输出不反映存储池的更改。要更新并显示最新的统计信息,您必须重启调度程序服务。在调度停机时间期间执行重启,因为它会导致微小的中断。
重建卷支持的服务器
此发行版本添加了对使用相同或不同镜像重建卷支持的服务器的支持。
将 director 部署的 Ceph 集群迁移到外部 Ceph 集群
在这个版本中,在从 RHOSP 17.1 升级到 RHOSO 18.0 数据平面后,您可以迁移 Director 部署的 Ceph 集群并将其转换为外部 Ceph 集群。在 Controller 节点上部署的 Ceph 守护进程迁移到一组目标节点。
用于 VAST Data Platform 的共享文件系统服务(manila)支持
共享文件系统服务现在包含支持 VAST Data Platform 的存储驱动程序。驱动程序允许通过快照置备和管理 NFS 共享以及时间备份。
Block Storage 服务(cinder)卷删除
在这个版本中,块存储服务 RBD 驱动程序利用最新的 Ceph 开发,允许 RBD 卷满足正常的卷删除预期。
在以前的版本中,当块存储服务使用 RBD (Ceph)卷后端时,并不总是可以删除卷。
3.2.9.2. 已知问题
这部分论述了 Red Hat OpenStack Services on OpenShift 18.0 中已知的问题。
当 uniquePodNames
为 true
时,对实例的 extraMounts
传播无法正常工作
当 uniquePodNames
为 true
时,每个 Cinder Pod (通常每个组件和服务)都以 pseudo-random 字符串作为前缀。这会影响每个实例传播,因为基于 字符串.TrimPrefix
的传统方法不再有效。
在 DCN 部署中,红帽建议通过匹配实例 AZ 名称将 secret 传播到 pod。
示例 1 会导致名称与 az0 匹配的 pod 获取 secret ceph-conf-az-0,其名称与 az1 匹配的 pod 获取 secret ceph-conf-az-0 等。示例 1 适用于 Glance pod,但如果 uniquePodNames
为 false
,则仅适用于 Cinder pod。
临时解决方案: 将 uniquePodNames
设置为 false,如示例 2 所示,直到这个问题解决为止。只有在存储后端使用 NFS 时,才需要 uniquePodNames
设置。
示例 1
apiVersion: core.openstack.org/v1beta1 kind: OpenStackControlPlane spec: extraMounts: - extraVol: - extraVolType: Ceph mounts: - mountPath: /etc/ceph name: ceph0 readOnly: true propagation: - az0 volumes: - name: ceph0 projected: sources: - secret: name: ceph-conf-az-0 - extraVolType: Ceph mounts: - mountPath: /etc/ceph name: ceph1 readOnly: true propagation: - az1 volumes: - name: ceph1 projected: sources: - secret: name: ceph-conf-az-1
示例 2
apiVersion: core.openstack.org/v1beta1 kind: OpenStackControlPlane <...> spec: cinder: uniquePodNames: false # workaround https://issues.redhat.com/browse/OSPRH-11240 enabled: true apiOverride: <...>
3.2.10. 升级和更新
3.2.10.1. 新功能
这部分描述了 OpenShift 18.0 上的 Red Hat OpenStack Services 中引入的新功能和主要改进。
OS-diff
工具标识源 17.1 和采用 RHOSO 环境之间的区别
RHOSO 提供了 os-diff 工具
,它可帮助 operator 查找源 OSP 17.1 环境配置和所采用的 RHOSO 环境配置之间的区别。
裸机采用
现在,您可以在 RHOSO 环境中采用 baremetal OSP 17.1 环境。
采用回滚
现在,您可以回滚 RHOSP 17.1 control plane 的使用失败。
3.2.10.2. 程序错误修复
这部分论述了 Red Hat OpenStack Services on OpenShift 18.0 中修复的、对用户有严重影响的错误。
不再生成错误的错误消息
在以前的版本中,当某些服务没有部署到源云中时,Keystone 服务和端点清理流程中的步骤会生成假错误。不再生成 false 错误。