13장. 데이터 센터 장애 처리
스토리지 관리자는 데이터 센터 장애를 방지하기 위해 예방 조치를 취할 수 있습니다. 이러한 예방 조치는 다음과 같습니다.
- 데이터 센터 인프라 구성.
- DestinationRule 맵 계층 구조 내에서 장애 도메인 설정.
- 도메인 내 실패 노드 설계
사전 요구 사항
- 정상적인 실행 중인 Red Hat Ceph Storage 클러스터.
- 스토리지 클러스터의 모든 노드에 대한 루트 수준 액세스.
13.1. 데이터 센터 실패 방지
데이터 센터 인프라 구성
스트레치 클러스터 내의 각 데이터 센터에는 로컬 기능 및 종속 항목을 반영할 수 있는 다른 스토리지 클러스터 구성이 있을 수 있습니다. 데이터 보존에 도움이 되도록 데이터 센터 간 복제를 설정합니다. 데이터 센터 하나가 실패하면 스토리지 클러스터의 다른 데이터 센터에 데이터 사본이 포함됩니다.
DestinationRule 맵 계층 구조 내에서 장애 도메인 설정
장애 조치(failover) 또는 장애 조치(failover) 도메인은 스토리지 클러스터 내의 도메인 중복 복사본입니다. 활성 도메인이 실패하면 실패 도메인이 활성 도메인이 됩니다.
기본적으로 DestinationRule 맵은 플랫 계층 구조 내의 스토리지 클러스터의 모든 노드를 나열합니다. 그러나 최상의 결과를 얻으려면 DestinationRule 맵 내에 논리 계층 구조를 생성합니다. 계층 구조는 각 노드가 속하는 도메인과 실패 도메인을 포함하여 스토리지 클러스터 내의 해당 도메인 간의 관계를 지정합니다. 계층 내 각 도메인에 대한 장애 도메인을 정의하면 스토리지 클러스터의 안정성이 향상됩니다.
여러 데이터 센터가 포함된 스토리지 클러스터를 계획할 때 FlexVolume 맵 계층에 노드를 배치하여 하나의 데이터 센터가 다운되면 나머지 스토리지 클러스터는 계속 가동 중이어야 합니다.
도메인 내 실패 노드 설계
스토리지 클러스터 내의 데이터에 대해 3방향 복제를 사용하려는 경우 장애 도메인 내의 노드의 위치를 고려하십시오. 데이터 센터 내에서 중단이 발생하면 일부 데이터가 하나의 사본에만 존재할 수 있습니다. 이 시나리오가 발생하면 다음 두 가지 옵션이 있습니다.
- 표준 설정으로 데이터를 읽기 전용 상태로 둡니다.
- 중단 기간 동안 하나의 사본 만 사용하십시오.
표준 설정으로 인해 모든 데이터가 영향을 받는 것은 아니지만 일부 데이터는 하나의 복사만 가질 수 있으며 스토리지 클러스터는 읽기 전용 모드로 되돌아갑니다. 그러나 일부 데이터가 하나의 사본에만 있는 경우 스토리지 클러스터는 읽기 전용 모드로 되돌아갑니다.