8.2. Regional-DR 문제 해결


8.2.1. RBD-mirror 데몬 상태가 warning 상태입니다.

문제

mirror 서비스 ::get_mirror_service_status 호출 Ceph monitor를 호출하여 rbd-mirror 의 서비스 상태를 가져오는 경우 WARNING가 보고되는 경우가 많습니다.

네트워크 연결 해제 후 rbd-mirror 데몬 상태는 경고 상태에 있으며 두 클러스터 간의 연결이 모두 정상입니다.

해결 방법

toolbox에서 다음 명령을 실행하고 leader:false를 찾습니다.

rbd mirror pool status --verbose ocs-storagecluster-cephblockpool | grep 'leader:'

출력에 다음이 표시되면 다음을 수행합니다.

리더: false

데몬 시작 문제가 있으며 가장 큰 근본 원인은 보조 클러스터에 안정적으로 연결하는 문제로 인해 발생할 수 있습니다.

해결방법: 포드를 삭제하고 다른 노드에서 다시 예약되었는지 확인하여 rbd-mirror Pod를 다른 노드로 이동합니다.

Leader: true 또는 no output

Red Hat 지원에 문의하십시오.

BZ 참조: [2118627]

문제

volSync 소스 Pod는volSync 대상 Pod의 호스트 이름을 확인할 수 없습니다. volSync Pod의 로그에는 다음 로그 스니펫과 유사한 기간 동안 오류 메시지가 일관되게 표시됩니다.

$ oc logs -n busybox-workloads-3-2 volsync-rsync-src-dd-io-pvc-1-p25rz

출력 예

VolSync rsync container version: ACM-0.6.0-ce9a280
Syncing data to volsync-rsync-dst-dd-io-pvc-1.busybox-workloads-3-2.svc.clusterset.local:22 ...
ssh: Could not resolve hostname volsync-rsync-dst-dd-io-pvc-1.busybox-workloads-3-2.svc.clusterset.local: Name or service not known
해결 방법

두 노드에서 submariner-lighthouse-agent 를 다시 시작합니다.

$ oc delete pod -l app=submariner-lighthouse-agent -n submariner-operator
문제

허브 클러스터가 실패하는 경우 관리 클러스터에 대한 ApplicationSet 기반 워크로드 배포는 가비지 수집되지 않습니다. 워크로드가 남아 있는 관리형 클러스터로 장애 조치되는 동안 대기 허브 클러스터로 복구됩니다. 워크로드가 실패한 클러스터에서 새 복구 대기 허브에 다시 참여합니다.

DR이 보호되는 ApplicationSet은 지역 DRPolicy로 보호되므로 VolumeSynchronizationDelay 경고를 실행하기 시작합니다. 두 클러스터 간에 데이터가 동기화되지 않아 DR 보호 워크로드를 피어 클러스터로 장애 조치하거나 피어 클러스터로 재배치할 수 없습니다.

해결 방법

이 문제를 해결하려면 openshift-gitops Operator에서 새 복구 허브에서 수행된 워크로드 장애 조치(failover)에 다시 가입한 후 관리 클러스터에서 분리되는 워크로드 리소스를 소유할 수 있어야 합니다. 이를 위해 다음 단계를 수행할 수 있습니다.

  1. openshift-gitops 네임스페이스의 hub 클러스터에서 ArgoCD ApplicationSet 리소스에서 사용 중인 배치를 확인합니다.
  2. 이 필드에서 ApplicationSet의 배치 레이블 값을 검사합니다. spec.generators.clusterDecisionResource.labelSelector.matchLabels

    배치 리소스 < placement-name>의 이름입니다.

  3. ApplicationSet 참조 배치에 대한 PlacemenDecision 이 있는지 확인합니다.

    $ oc get placementdecision -n openshift-gitops --selector cluster.open-cluster-management.io/placement=<placement-name>

    이로 인해 단일 PlacementDecision 이 생성되어 현재 원하는 페일오버 클러스터에 워크로드를 배치합니다.

  4. 정리해야 하는 클러스터를 가리키는 ApplicationSet에 대한 새 PlacementDecision 을 생성합니다.

    예를 들면 다음과 같습니다.

    apiVersion: cluster.open-cluster-management.io/v1beta1
    kind: PlacementDecision
    metadata:
      labels:
        cluster.open-cluster-management.io/decision-group-index: "1" # Typically one higher than the same value in the esisting PlacementDecision determined at step (2)
        cluster.open-cluster-management.io/decision-group-name: ""
        cluster.open-cluster-management.io/placement: cephfs-appset-busybox10-placement
      name: <placemen-name>-decision-<n> # <n> should be one higher than the existing PlacementDecision as determined in step (2)
      namespace: openshift-gitops
  5. 새로 생성된 PlacementDecision 을 status 하위 리소스로 업데이트합니다.

    decision-status.yaml:
    status:
      decisions:
      - clusterName: <managedcluster-name-to-clean-up> # This would be the cluster from where the workload was failed over, NOT the current workload cluster
        reason: FailoverCleanup
    $ oc patch placementdecision -n openshift-gitops <placemen-name>-decision-<n> --patch-file=decision-status.yaml --subresource=status --type=merge
  6. ApplicationSet의 애플리케이션 리소스가 원하는 클러스터에 배치되었는지 확인합니다.

    $ oc get application -n openshift-gitops  <applicationset-name>-<managedcluster-name-to-clean-up>

    출력에서 SYNC STATUS가 Synced 로 표시되고 HEALTH STATUS가 Healthy 로 표시되는지 확인합니다.

  7. ArgoCD가 <managedcluster-name-to-clean-up>에서 워크로드 리소스를 수집할 수 있도록 3단계에서 생성된 PlacementDecision을 삭제합니다.

    $ oc delete placementdecision -n openshift-gitops <placemen-name>-decision-<n>

지역 DRPolicy를 사용하여 DR로 보호되는 ApplicationSet은 VolumeSynchronizationDelay 경고 실행을 중지합니다.

BZ 참조: [2268594]

Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2026 Red Hat
맨 위로 이동