3.6. RADOS
更新以使用 ping 时间来跟踪网络性能
在以前的版本中,当发生网络问题时,很难区分其他性能问题。在这个版本中,如果平均 Red Hat Ceph Storage OSD heartbeat 超过任何计算间隔的可配置阈值,则会生成一个 heath 警告。Red Hat Ceph Storage OSD 计算 1 分钟、5 分钟和 15 分钟间隔,其平均值、最小和最大值。
在仪表板中添加 BlueStore 压缩统计
在这个版本中,BlueStore OSD 的相关性能指标在仪表板中可见。
有关仪表板的更多信息,请参阅 控制面板指南。
当 Ceph OSD 遇到 I/O 错误时,存储集群状态会改变
在这个版本中,Ceph Monitor 有一个 mon_osd_warn_num_repaired
选项,它默认设置为 10
。如果任何 Ceph OSD 在存储的数据中修复了大量 I/O 错误,则会生成一个 OSD_TOO_MANY_REPAIRS
健康警告状态。要清除此警告,新的 clear_shards_repaired
选项已添加到 ceph tell
命令中。例如:
ceph tell osd.NUMBER clear_shards_repaired [COUNT]
默认情况下,clear_shards_repaired
选项可将 repair 数设置为 0。
如果执行额外的 Ceph OSD 修复,则需要再次警告,您可以指定 mon_osd_warn_num_repaired
选项的值。
更新至心跳宽限期
在以前的版本中,当没有超过 48 小时的 Ceph OSD 失败时,没有将宽限期重置为默认值的机制。在这个版本中,如果 Ceph OSD 没有故障时间为 48 小时,则心跳宽限期被重置为默认值 20 秒。当最后一次失败和最新失败之间的故障间隔超过 48 小时时,宽限期将重置为默认值 20 秒。
宽限期是 Ceph 存储集群因没有心跳而将 Ceph OSD 视为 down 的时间间隔。宽限期基于滞后或 Ceph ODS 遇到失败的频率进行扩展。
osd_client_message_cap
选项已添加回
在以前的版本中,osd_client_message_cap
选项已被删除,但在这个版本中,osd_client_message_cap
选项已被重新引入。此选项有助于通过限制这些请求来控制容器内客户端请求的最大数量。当 Ceph OSD 出现大量基于客户端的流量时,这样做会很有用。