6.10. 不健康的阻塞节点故障排除


6.10.1. ODFRBDClientBlocked

含义

此警报表示 Ceph 在 Kubernetes 集群的特定节点上可能会阻止 RADOS 块设备(RBD)客户端。当 ocs_rbd_client_blocklisted metric 为节点报告了 1 时,将发生阻止行为。另外,在同一节点上存在 CreateContainerError 状态的 pod。阻塞列表可能会导致使用 RBD 的持久性卷声明 (PVC) 的文件系统变为只读。调查此警报非常重要,以防止对存储集群造成任何中断。

影响

诊断

由于多个因素(如网络或集群速度较慢)可能会出现 RBD 客户端阻止列表。在某些情况下,三个持续客户端(工作负载、镜像守护进程和 manager/scheduler)之间的专用锁争用可能会导致 blocklist。

缓解方案

  1. 为被放入阻塞列表的节点添加污点:在 Kubernetes 中,请考虑污点节点,以触发 pod 驱除到另一节点。这个方法假设卸载/取消映射过程正常进行。pod 成功被驱除后,可能会取消阻塞节点,允许清除 blocklist。然后可将 pod 移到未包含的节点。
  2. 重启列入阻塞列表的节点:如果污点节点并驱除 pod 没有解决阻塞的问题,则可以尝试重启列入阻塞列表的节点。此步骤可能帮助缓解导致 blocklist 并恢复正常功能的任何底层问题。
重要

及时调查并解决 blocklist 问题对于避免对存储集群有进一步影响至关重要。

返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat