6.9. RADOS
当存储集群中没有 Ceph Manager 或 OSD 时,会报告一个健康警告状态
在以前的 Red Hat Ceph Storage 版本中,存储集群健康状态是 HEALTH_OK
,即使存储集群中没有 Ceph Manager 或 OSD。在这个版本中,此健康状态已更改,如果存储集群没有使用 Ceph Manager 设置,或所有 Ceph Manager 都停机,则会报告健康警告。由于 Red Hat Ceph Storage 大量依赖于 Ceph 管理器来提供主要功能,因此不建议在没有 Ceph 管理器或 OSD 的情况下运行 Ceph 存储集群。
ceph config show
命令显示正确的 fsid
在以前的版本中,ceph config show
命令只显示 Ceph Monitor 数据库中存在的配置键,因为 fsid
是一个 NO_MON_UPDATE
配置值,所以 fsid
无法正确显示。在这个版本中,ceph config show
命令显示正确的 fsid
值。
RADOS 中的小对象和文件不再使用超过所需空间
Ceph 对象网关和 Ceph 文件系统 (CephFS) 将小对象和文件作为单独的对象存储在 RADOS 中。在以前的版本中,小于 BlueStore 的默认最小分配大小(min_alloc_size
)的对象使用 16 KB 的空间比要求多。这是因为,BlueStore 的 min_alloc_size
的默认值是 16 KB 用于固态设备(SSD)。目前,SSD 的 min_alloc_size
的默认值为 4 KB。这可以更好地利用空间,且不会影响性能。
slow ops 没有记录在集群日志中
在以前的版本中,slow ops 没有记录在集群日志中。它们登录到 osd
或 mon
日志,但缺少预期的详情级别。在这个版本中,slow ops 被记录在集群日志中,它有一定程度的详细信息,使日志可用于调试。
回填在放置组合并过程中不再延迟
在以前的版本中,在 Red Hat Ceph Storage 放置组合并中,如果在合并前为源和目标放置组设置的时间比预期的要长。当不匹配时,回填操作可能会显示为停滞。在 Red Hat Ceph Storage 4.1z1 中,代码已更新为仅合并其活跃集合匹配的放置组。此更改允许合并在没有延迟的情况下完成。
Ceph 监控可能会超过内存目标
自动调整内存目标仅在 Ceph 监控领导机上执行,而不是 Ceph 监控器遵循领导。这会导致 Ceph Monitor 遵循者超过集合的内存目标,从而导致 Ceph 监控器在内存耗尽后崩溃。在这个版本中,自动调整过程为 Ceph Monitor 领导及其后续程序应用内存目标,以便系统上的内存不会耗尽。
当 OSD 长时间停机时,磁盘空间使用量不会增加
在以前的版本中,当 OSD 长时间停机时,会存储大量 osdmaps,且不会修剪。这会导致磁盘用量过高。在 Red Hat Ceph Storage 4.1z1 中,无论 OSD 和磁盘空间没有被过度使用,osdmaps 都会被修剪。
当使用非零错误代码退出 smartctl
时,健康指标会被正确报告
在以前的版本中,如果 smartctl
以非零错误代码退出,ceph device get-health-metrics
命令可能无法报告指标,即使运行 smartctl
会直接报告正确的信息。在这种情况下,会报告 JSON 错误。在 Red Hat Ceph Storage 4.1z1 中,ceph device get-health-metrics
命令会报告指标,即使 smartctl
本身报告正确的信息,即使 smartctl
退出了非零错误代码。
崩溃由负时间范围导致的 Ceph 监控器
在以前的版本中,当由 monotonic 时钟触发时,Ceph Monitor 可能会崩溃。这些崩溃导致一个负的 monotonic 时间范围,并在 Ceph 监控器中触发断言并导致它们崩溃。Ceph 监控代码已更新,可以容忍此断言,并将其解释为零长度间隔,而不是负值。因此,在进行这个断言时,Ceph Monitor 不会崩溃。
对存储集群中消息的编码和解码的改进
在部署包含异构架构的 Red Hat Ceph Storage 集群时,如 x86_64 和 s390,可能会导致系统崩溃。另外,在 CephFS 的某些工作负载下,s390x 节点上的 Ceph 监控可能会意外崩溃。在这个版本中,使用标记 1
正确解码 entity_addrvec_t
,使用中间整数变量类型正确解码 big-endian 系统上的 enum
类型,并在 big-endian 系统上固定编码和解码 浮点
数类型。因此,s390x 节点上的异构存储集群和 Ceph Monitor 不再崩溃。