8.3. 使用 Arbiter 对 2-site 扩展集群进行故障排除
8.3.1. 在区恢复后恢复后恢复工作负载 pod 处于 ContainerCreating 状态 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
- 问题
执行完整的区失败和恢复后,工作负载 pod 有时会处于
ContainerCreating状态,并显示以下错误:- MountDevice 无法创建 newCsiDriverClient: 驱动程序名称 openshift-storage.rbd.csi.ceph.com 没有在注册的 CSI 驱动程序列表中找到
- 对于卷 < volume_name > : rpc error: code = Aborted desc = a operation with the given Volume ID < volume_id& gt; 已存在,mountDevice 失败
- MountVolume.SetUp failed for volume < ;volume_name> ; : rpc error: code = Internal desc = staging path < ;path> for volume <volume_id > 不是挂载点
- 解决方案
如果工作负载 pod 卡住上述错误,请执行以下临时解决方案:
对于 ceph-fs 工作负载,处于
ContainerCreating中:- 重启调度卡住 pod 的节点
- 删除这些卡住的 pod
- 验证新 pod 是否正在运行
对于 ceph-rbd 工作负载,在一段时间后没有进行自我恢复的
ContainerCreating- 在调度卡住 pod 的节点中重启 csi-rbd 插件 pod
- 验证新 pod 是否正在运行