第 4 章 程序错误修复


本节论述了 Red Hat OpenShift Container Storage 4.7 中引入了重要的程序错误修复。

MGR pod 即使 MON 停机也会重启

在以前的版本中,当节点重启 MGR pod 时,可能一直处于 pod 的初始状态,从而导致无法创建新的持久性卷(PV)。在这个版本中,MGR pod 也会重启,即使 MON 已关闭。

(BZ#2005515)

现在,当 OpenShift Container Platform 上启用了巨页时,Multicloud Object Gateway 现已可用

在以前的版本中,当启用巨页时,多云对象网关(MCG)db pod 会崩溃,因为 Postgres 无法在 kubernetes 上运行。在当前更新时,MCG Postgres Pod 的巨页被禁用,因此 MCG db pod 不会崩溃。

(BZ#1968438)

PodDisruptionBudget 警报不再持续显示

在以前的版本中,PodDisruptionBudget 警报被持续显示为 OpenShift Container Platform 警报,用于对象存储设备(OSD)。这个问题已解决,警报不再显示。

(BZ#1788126)

must-gather 日志收集失败

在以前的版本中,复制 pod 不会定期重新清空数据,从而导致 must-gather 命令在默认的 10 分钟超时后失败。在这个版本中,复制 pod 会定期尝试按照 must-gather 命令生成的间隔收集数据,现在 must-gather 命令会运行完成。

(BZ#1884546)

如果没有 volumesnapshotclass,则无法从卷快照创建 PVC

如果没有 volumesnapshotclass,则无法从卷快照创建一个 PVC。造成这个问题的原因是,卷快照的状态在删除 volumesnapshotclass 时变为 未就绪状态。这个问题已在 OCP 4.7.0 及更高版本中解决。

(BZ#1902711)

如果进程崩溃,则不会传播内核转储

在以前的版本中,如果进程崩溃,内核转储不会被传播。在这个版本中,增加了一个日志收集器,它是主 ceph 守护进程旁边运行的 sidecar。因此,启用了 ShareProcessNamespace 标志,此标志信号可以在允许生成 coredumps 的容器间进行截获。

(BZ#1904917)

多 OSD 移除任务不再失败

在以前的版本中,当为多个 OSD 移除触发作业时,模板会在作业名中包含一个带有逗号的 OSD ID。这会导致任务模板失败。在这个版本中,OSD ID 已从作业名称中删除,以保持有效格式。作业名称已从 ocs-osd-removal-${FAILED_OSD_IDS} 改为 ocs-osd-removal-job

(BZ#1908678)

增加了 mon 故障转移超时

在这个版本中,在 IBM Cloud 上将 mon 故障转移超时增加到 15 分钟。在以前的版本中,mon 会开始故障转移,当它们仍在上线时。

(BZ#1922421)

Rook 现在会拒绝在检测之前 OpenShift Container Storage 安装中未清除的磁盘上部署带有消息的 OSD

在以前的版本中,如果从以前的 OpenShift Container Storage 安装中没有清理的磁盘被重复使用,Rook 会失败。在这个版本中,Rook 可以被检测到磁盘是否属于不同的集群,并拒绝该磁盘中的 OSD 部署并显示错误消息(BZ#1922954)

MON 故障转移不再使 Ceph 无法访问

在以前的版本中,如果在另一个 mon 失败时出现意外停止,会导致 mons 丢失仲裁。当 mons 丢失仲裁时,Ceph 变得不可访问。在这个版本中,voluntary mon 排空操作会在 mon 失败时排空操作,以便 Ceph 不会变得无法访问。

(BZ#1935065)

cpehcsi node plugin pod 会预先填充 GRPC 指标的端口

在以前的版本中,cephcsi pod 为调试目的公开 GRPC 指标,因此 cephcsi 节点插件 pod 将端口 9090 用于 RBD 和 9091 用于 CephFS。因此,cephsi pod 可能会因为端口不可用而失败。在这个版本中,GRPC 指标会被默认禁用,因为它只需要用于调试目的,现在 cephcsi 不会在运行节点插件 pod 的节点中使用端口 9091 和 9090。

(BZ#1937245)

rook-ceph-mds 没有在监控服务器中注册 pod IP

在以前的版本中,rook-ceph-mds 没有将 pod IP 注册到监控器服务器,因此每个挂载都超时,因此 PVC 可能无法置备,从而导致 CephFS 卷置备失败。在这个版本中,当主机网络没有启用时,参数 --public-addr=podIP 会被添加到 MDS pod 中。因此,现在 CephFS 卷置备不会失败。

(BZ#1939272)

因为失败的规则评估,must gather 中有错误

在以前的版本中,记录规则记录:cluster:ceph_disk_latency:join_ceph_node_disk_irate1m 不会被评估,因为 Prometheus 中不允许 many-to-many 匹配。因此,因为这个失败的规则评估,在 must gather 和部署中存在错误。在这个版本中,对记录规则的查询已更新,以消除 many-to-many 的匹配情况,因此现在 Prometheus 规则评估应该不会失败,且不应在部署中看到任何错误。

(BZ#1904302)

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.