7.2. regional-DR 문제 해결
7.2.1. 일부 이미지에 대해 RBD 미러링 예약이 중지됨 링크 복사링크가 클립보드에 복사되었습니다!
- 문제
일부 이미지에서 RBD 미러링 예약이 중지되는 몇 가지 일반적인 원인이 있습니다.
미러링을 위해 애플리케이션을 표시한 후 어떤 이유로든 복제되지 않은 경우 toolbox Pod를 사용하고 다음 명령을 실행하여 중지된 이미지 스케줄링을 확인합니다.
rbd snap ls <poolname/imagename> –all
$ rbd snap ls <poolname/imagename> –allCopy to Clipboard Copied! Toggle word wrap Toggle overflow - 해결
- 기본 클러스터에서 manager 데몬을 재시작
- 기본 클러스터에서 영향을 받는 이미지에서 미러링을 비활성화하고 즉시 다시 활성화합니다.
7.2.2. RBD-mirror 데몬 상태가 경고 상태입니다. 링크 복사링크가 클립보드에 복사되었습니다!
- 문제
미러 서비스
::get_mirror_service_status가Ceph모니터를 호출하여rbd-mirror의 서비스 상태를 가져오는 경우 WARNING이 보고되는 경우가 많습니다.네트워크 연결 끊기 후
rbd-mirror데몬 상태는경고상태에 있는 동안 관리 클러스터 간 연결이 정상입니다.- 해결
toolbox에서 다음 명령을 실행하고
leader:false를 찾습니다.rbd mirror pool status --verbose ocs-storagecluster-cephblockpool | grep 'leader:'
rbd mirror pool status --verbose ocs-storagecluster-cephblockpool | grep 'leader:'Copy to Clipboard Copied! Toggle word wrap Toggle overflow 출력에 다음이 표시되는 경우:
leader: false이는 데몬 시작 문제가 있고 보조 클러스터에 안정적으로 연결하는 문제로 인해 발생할 가능성이 가장 큰 원인일 수 있음을 나타냅니다.
해결방법: pod를 삭제하여
rbd-mirrorPod를 다른 노드로 이동하고 다른 노드에서 다시 예약되었는지 확인합니다.Leader: true또는 no output
BZ reference: [2118627]
7.2.3. volsync-rsync-src Pod가 대상 호스트 이름을 확인할 수 없기 때문에 오류 상태입니다. 링크 복사링크가 클립보드에 복사되었습니다!
- 문제
gRPCSync소스 pod가 segmentSync 대상 Pod의 호스트 이름을 확인할 수 없습니다. IKEvSync Pod의 로그는 다음 로그 스니펫과 유사한 연장된 기간 동안 오류 메시지를 일관되게 보여줍니다.oc logs -n busybox-workloads-3-2 volsync-rsync-src-dd-io-pvc-1-p25rz
$ oc logs -n busybox-workloads-3-2 volsync-rsync-src-dd-io-pvc-1-p25rzCopy to Clipboard Copied! Toggle word wrap Toggle overflow 출력 예
VolSync rsync container version: ACM-0.6.0-ce9a280 Syncing data to volsync-rsync-dst-dd-io-pvc-1.busybox-workloads-3-2.svc.clusterset.local:22 ... ssh: Could not resolve hostname volsync-rsync-dst-dd-io-pvc-1.busybox-workloads-3-2.svc.clusterset.local: Name or service not known
VolSync rsync container version: ACM-0.6.0-ce9a280 Syncing data to volsync-rsync-dst-dd-io-pvc-1.busybox-workloads-3-2.svc.clusterset.local:22 ... ssh: Could not resolve hostname volsync-rsync-dst-dd-io-pvc-1.busybox-workloads-3-2.svc.clusterset.local: Name or service not knownCopy to Clipboard Copied! Toggle word wrap Toggle overflow - 해결
두 노드에서
submariner-lighthouse-agent를 다시 시작합니다.oc delete pod -l app=submariner-lighthouse-agent -n submariner-operator
$ oc delete pod -l app=submariner-lighthouse-agent -n submariner-operatorCopy to Clipboard Copied! Toggle word wrap Toggle overflow