7.3. 使用 Arbiter 对 2 站点扩展集群进行故障排除


管理员可以使用此故障排除信息,了解如何使用仲裁环境对双站点扩展集群进行故障排除和修复。

7.3.1. 在区恢复后恢复工作负载 pod 处于 ContainerCreating 状态

问题

执行完区失败和恢复后,工作负载 pod 有时会处于 ContainerCreating 状态,并显示以下错误:

  • MountDevice 无法创建 newCsiDriverClient: 驱动程序名称 openshift-storage.rbd.csi.ceph.com,在注册的 CSI 驱动程序列表中找不到
  • <volume_name> MountDevice 失败:rpc error: code = Aborted desc = an operation with the given Volume ID <volume_id> already exists
  • <volume_name> MountVolume.SetUp 失败:rpc error: code = Internal desc = staging path <path> for volume <volume_id> is not a mountpoint
解决方案

如果工作负载 pod 遇到上述任何错误,请执行以下临时解决方案:

  • 对于 ceph-fs 工作负载,处于 ContainerCreating 中:

    1. 重启调度卡住 pod 的节点
    2. 删除这些卡住的 pod
    3. 验证新 pod 是否正在运行
  • 对于 ceph-rbd 工作负载,在 ContainerCreating 中,在一段时间后不会进行自助恢复

    1. 在调度卡住 pod 的节点中重启 csi-rbd 插件 pod
    2. 验证新 pod 是否正在运行
返回顶部
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2025 Red Hat, Inc.