4.10. 관리형 클러스터 간 ApplicationSet 기반 애플리케이션 페일오버
장애 조치(failover)는 기본 클러스터 장애 발생 시 기본 클러스터에서 보조 클러스터로 애플리케이션을 전환하는 프로세스입니다. 장애 조치(failover)를 통해 보조 클러스터에서 최소한의 중단으로 애플리케이션을 실행할 수 있지만 기본 클러스터에서 보조 클러스터로 부터 보조 클러스터로 인해 눈에 띄지 않는 복제 오류 발생과 같은 형식화되지 않은 장애 조치 결정을 내릴 수 있습니다. 마지막으로 성공한 복제 이후 상당한 시간이 걸리면 실패한 기본 데이터베이스가 복구될 때까지 기다리는 것이 가장 좋습니다.
LastGroupSyncTime은 애플리케이션과 연결된 모든 PVC에 대해 마지막으로 성공한 복제 이후의 시간을 반영하는 중요한 지표 입니다. 본질적으로 기본 클러스터와 보조 클러스터 간의 동기화 상태를 측정합니다. 따라서 한 클러스터에서 다른 클러스터로 장애 조치(failover)를 시작하기 전에 이 메트릭을 확인하고 LastGroupSyncTime이 과거의 적절한 시간 내에 있는 경우에만 장애 조치(failover)를 시작합니다.
페일오버를 수행하는 동안 장애 조치(failover) 클러스터에서 Ceph-RBD 미러 배포가 축소되어 스토리지 프로비저너로 Ceph-RBD에서 지원하는 볼륨에 대한 명확한 페일오버가 보장됩니다.
사전 요구 사항
- 설정에 활성 및 수동 RHACM 허브 클러스터가 있는 경우 Red Hat Advanced Cluster Management를 사용하여 Hub 복구를 참조하십시오.
기본 클러스터가
Ready이외의 상태인 경우 업데이트하는 데 시간이 걸릴 수 있으므로 클러스터의 실제 상태를 확인합니다.-
RHACM 콘솔
인프라 클러스터 클러스터 목록 탭 으로 이동합니다. 장애 조치(failover) 작업을 수행하기 전에 두 클러스터의 상태를 개별적으로 확인합니다.
그러나 실패한 클러스터가 Ready 상태인 경우에도 장애 조치 작업을 수행할 수 있습니다.
-
RHACM 콘솔
Hub 클러스터에서 다음 명령을 실행하여 현재 시간과 비교하여
lastGroupSyncTime이 허용 가능한 데이터 손실 창 내에 있는지 확인합니다.oc get drpc -o yaml -A | grep lastGroupSyncTime
$ oc get drpc -o yaml -A | grep lastGroupSyncTimeCopy to Clipboard Copied! Toggle word wrap Toggle overflow 출력 예:
[...] lastGroupSyncTime: "2023-07-10T12:40:10Z"
[...] lastGroupSyncTime: "2023-07-10T12:40:10Z"Copy to Clipboard Copied! Toggle word wrap Toggle overflow
프로세스
- Hub 클러스터에서 Applications.
- 애플리케이션 행 끝에 있는 작업 메뉴를 클릭하여 사용 가능한 작업 목록을 확인합니다.
- Cryo stat 애플리케이션을 클릭합니다.
- Cryo stat 애플리케이션 모달이 표시되면 표시되는 세부 정보가 올바른지 확인하고 Cryostat 준비 상태를 확인합니다. 녹색 눈금으로 준비 상태가 되면 대상 클러스터가 장애 조치(failover)를 시작할 준비가 되었음을 나타냅니다.
- Initiate 를 클릭합니다. 이제 busybox 리소스가 대상 클러스터에서 생성됩니다.
- 모달 창을 닫고 애플리케이션 페이지의 데이터 정책 열을 사용하여 상태를 추적합니다.
애플리케이션의 활동 상태가 FailedOver 로 표시되는지 확인합니다.
-
애플리케이션
개요 탭으로 이동합니다. - 데이터 정책 열에서 정책을 적용한 애플리케이션의 정책 링크를 클릭합니다.
- 데이터 정책 팝업에서 애플리케이션에 사용 중인 정책과 관련된 하나 이상의 정책 이름과 지속적인 활동이 표시되는지 확인합니다.
-
애플리케이션