14장. 데이터 센터 실패 처리
스토리지 관리자는 데이터 센터 실패를 방지하기 위해 예방 조치를 취할 수 있습니다. 이러한 예방 조치에는 다음이 포함됩니다.
- 데이터 센터 인프라 구성.
- CRUSH 맵 계층 구조 내에서 장애 도메인 설정.
- 도메인 내에서 장애 노드 지정.
사전 요구 사항
- 정상 실행 Red Hat Ceph Storage 클러스터.
- 스토리지 클러스터의 모든 노드에 대한 루트 수준 액세스.
14.1. 데이터 센터 오류 방지
데이터 센터 인프라 구성
확장 클러스터 내의 각 데이터 센터에는 로컬 기능 및 종속성을 반영하기 위해 다른 스토리지 클러스터 구성이 있을 수 있습니다. 데이터 보존을 위해 데이터 센터 간 복제를 설정합니다. 하나의 데이터 센터가 실패하면 스토리지 클러스터의 다른 데이터 센터에 데이터 사본이 포함됩니다.
CRUSH 맵 계층 구조 내에서 장애 도메인 설정
장애 조치(failover) 또는 장애 조치(failover) 도메인은 스토리지 클러스터 내에서 도메인의 중복 사본입니다. 활성 도메인이 실패하면 실패 도메인이 활성 도메인이 됩니다.
기본적으로 CRUSH 맵은 플랫 계층 구조 내의 스토리지 클러스터의 모든 노드를 나열합니다. 그러나 최상의 결과를 얻으려면 CRUSH 맵에 논리 계층 구조를 생성합니다. 계층 구조는 각 노드가 속한 도메인과 장애 도메인을 포함하여 스토리지 클러스터 내의 해당 도메인 간의 관계를 지정합니다. 계층 내에서 각 도메인의 실패 도메인을 정의하면 스토리지 클러스터의 안정성이 향상됩니다.
여러 데이터 센터가 포함된 스토리지 클러스터를 계획할 때 CRUSH 맵 계층 구조에 노드를 배치하여 한 데이터 센터가 다운되면 나머지 스토리지 클러스터가 가동되고 실행 중이 되도록 합니다.
도메인 내의 장애 노드 지정
스토리지 클러스터 내에서 데이터에 3방향 복제를 사용하려면 실패 도메인 내의 노드의 위치를 고려하십시오. 데이터 센터 내에서 중단이 발생하면 일부 데이터가 하나의 사본에만 존재할 수 있습니다. 이 시나리오가 발생하면 다음 두 가지 옵션이 있습니다.
- 표준 설정으로 데이터를 읽기 전용 상태로 둡니다.
- 중단 기간 동안 하나의 사본만 있습니다.
표준 설정에서 및 노드 전체의 데이터 배치의 무작위성 때문에 모든 데이터에 영향을 미치지는 않지만 일부 데이터에는 하나의 복사만 있을 수 있으며 스토리지 클러스터는 읽기 전용 모드로 되돌아갑니다. 그러나 일부 데이터가 하나의 사본에만 있는 경우 스토리지 클러스터는 읽기 전용 모드로 되돌아갑니다.