7.3. Arbiter를 사용하여 2개 사이트 확장 클러스터 문제 해결
7.3.1. ContainerCreating 상태 후 영역 복구에서 중단된 워크로드 Pod 복구 링크 복사링크가 클립보드에 복사되었습니다!
링크 복사링크가 클립보드에 복사되었습니다!
- 문제
전체 영역 장애 및 복구를 수행한 후 워크로드 Pod가 다음 오류 중 하나로
ContainerCreating상태로 중단되는 경우가 있습니다.- mountDevice failed to create newCsiDriverClient: driver name openshift-storage.rbd.csi.ceph.com not found in the list of registered CSI driver
- mountDevice failed for volume < volume_name > : rpc error: code = Aborted desc = 지정된 Volume ID < volume_id >가 이미 존재하는 경우
- mountVolume.SetUp failed for volume < volume_name > : rpc error: code = Internal desc = staging path < volume_id >는 마운트 지점이 아닙니다.
- 해결
워크로드 Pod에 위의 오류가 있는 경우 다음 해결 방법을 수행합니다.
ContainerCreating에 있는 ceph-fs 워크로드의 경우 :- 정지된 Pod가 예약된 노드 재시작
- 이러한 고정 Pod 삭제
- 새 포드가 실행 중인지 확인합니다.
경우에 따라 복구되지 않는
ContainerCreating에 있는 ceph-rbd 워크로드의 경우- 고정 Pod가 예약된 노드에서 csi-rbd 플러그인 Pod 재시작
- 새 포드가 실행 중인지 확인합니다.