1장. 인스턴스 HA 배포 소개 및 계획
Compute 인스턴스(인스턴스 HA)의 고가용성은 실패한 컴퓨팅 노드에서 인스턴스를 비우고 다른 컴퓨팅 노드에서 인스턴스를 다시 만드는 데 사용할 수 있는 툴입니다.
인스턴스 HA는 공유 스토리지 또는 로컬 스토리지 환경에서 작동하므로, 빈 인스턴스에서 고정 IP 주소 및 유동 IP 주소와 같은 동일한 네트워크 구성을 유지합니다. 또한 다시 생성된 인스턴스는 새 컴퓨팅 노드 내에서 동일한 특성을 유지합니다.
1.1. 인스턴스 HA 작동 방식 링크 복사링크가 클립보드에 복사되었습니다!
컴퓨팅 노드에 오류가 발생하면 오버클라우드 펜싱 에이전트에서 노드를 펜싱한 다음 인스턴스 HA 에이전트에서 실패한 컴퓨팅 노드에서 다른 컴퓨팅 노드로 인스턴스를 비웁니다.
컴퓨팅 노드가 실패하고 인스턴스 HA를 트리거하면 다음 이벤트가 발생합니다.
-
실패 시
IPMI에이전트는 노드를 물리적으로 재설정하여 종료되었는지 확인하고 오버클라우드에서 데이터 손상 또는 동일한 여러 인스턴스를 방지하는 1단계 펜싱을 수행합니다. 노드가 오프라인이면 펜싱된 것으로 간주됩니다. 물리적 IPMI 펜싱 후
fence-nova에이전트는 자동으로 두 번째 계층 펜싱을 수행하고 다음 명령을 실행하여 노드별로"evacuate=yes"클러스터를 표시합니다.attrd_updater -n evacuate -A name="evacuate" host="FAILEDHOST" value="yes"
$ attrd_updater -n evacuate -A name="evacuate" host="FAILEDHOST" value="yes"Copy to Clipboard Copied! Toggle word wrap Toggle overflow FAILEDHOST는 실패한 컴퓨팅 노드의 이름입니다.-
nova-evacuate에이전트는 백그라운드에서 지속적으로 실행되며"evacuate=yes"특성을 사용하여 클러스터에 노드가 있는지 주기적으로 확인합니다.nova-evacuate에서 펜싱된 노드에 이 특성이 포함되어 있음을 탐지하면 에이전트에서 노드 비우기를 시작합니다. 비우기 프로세스는 언제든지 수행할 수 있는 수동 인스턴스 비우기 프로세스와 유사합니다. -
IPMI를 재설정한 후 장애가 발생한 노드가 다시 시작되면 해당 노드의
nova-compute프로세스도 자동으로 시작됩니다. 이전에 노드가 펜싱되었으므로 Pacemaker에서 노드 펜싱을 해제할 때까지 새 인스턴스를 실행하지 않습니다. -
Pacemaker에서 계산 노드가 온라인임을 감지하면 노드에서
compute-unfence-trigger리소스 에이전트를 시작하여 노드를 해제하고 인스턴스를 다시 실행할 수 있습니다.