7.10. 不健康的块列出节点故障排除


7.10.1. ODFRBDClientBlocked

含义

此警报表示 RADOS 块设备(RBD)客户端可能会被 Kubernetes 集群内特定节点上的 Ceph 阻止。当 ocs_rbd_client_blocklisted 指标报告 节点的值 1 时,块列表发生。另外,同一节点上也有一个 CreateContainerError 状态的 pod。阻止列表可能会导致文件系统使用 RBD 变为只读 PVC。务必要调查此警报,以防止对存储集群造成任何中断。

影响

high

诊断

RBD 客户端的阻塞列表可能会因为几个因素而发生,如网络或集群较慢。在某些情况下,三个contend 客户端(工作负载、镜像守护进程和 manager/scheduler)之间的专用锁定竞争可能会导致 blocklist。

缓解方案

  1. 污点列入黑名单的节点:在 Kubernetes 中,请考虑将阻止的节点污点,以将 pod 的驱除触发到另一节点。这个方法依赖于正常卸载/取消映射过程的假设。当 pod 成功被驱除后,会取消包含阻塞的节点,允许清除 blocklist。然后,可以将 pod 移到未包含的节点。
  2. 重启列入黑名单的节点:如果污点节点并驱除 pod 无法解决阻止列表的问题,可以尝试重启阻塞的节点。此步骤可帮助减少导致黑名单和恢复正常功能的底层问题。
重要

及时调查和解决黑名单问题至关重要,以避免进一步对存储集群的影响。

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat