5.7. 노드 충돌로 인한 ASCS 인스턴스 장애 (ENSA2)
노드 ENSA 2 클러스터 환경이 3개인 경우 모든 인스턴스의 장애 조치(failover) 이벤트 중에 세 번째 노드가 고려됩니다.
테스트 사전 조건
-
ASCS및ERS실행의 리소스 그룹이 있는 3개의 노드 SAP S/4HANA 클러스터. - 3rd 노드는 모든 파일 시스템에 액세스할 수 있으며 첫 번째 2 노드와 동일한 방식으로 필요한 인스턴스별 IP 주소를 프로비저닝할 수 있습니다.
예제 설정에서 기본 공유
NFS파일 시스템은 다음과 같습니다.Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 리소스 및 리소스 그룹에 대한 모든 오류가 삭제되고 failcount가 재설정되었습니다.
-
테스트 작업
-
ASCS가 실행 중인 노드를 충돌합니다.
-
모니터링
테스트 중에 현재
ASCS그룹이 실행되지 않는 노드 중 하나에서 별도의 터미널에서 다음 명령을 실행합니다.watch -n 1 pcs status
[root@node2]# watch -n 1 pcs statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow
예상 동작
-
ASCS는 3rd 노드로 이동합니다. -
ERS는 이미 실행 중인 노드와 동일한 노드에서 계속 실행됩니다.
-
테스트
ASCS그룹이 현재 실행중인 노드를 충돌합니다.echo c > /proc/sysrq-trigger
[root@node1]# echo c > /proc/sysrq-triggerCopy to Clipboard Copied! Toggle word wrap Toggle overflow ASCS는 두 번째 노드에서 이미 실행 중인ERS인스턴스를 방해하지 않고 3 번째 노드로 이동합니다.pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node3 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node2[root@node2]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node3 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node2Copy to Clipboard Copied! Toggle word wrap Toggle overflow
복구 작업
다음과 같은 경우 실패한 작업을 정리합니다.
pcs resource cleanup
[root@node2]# pcs resource cleanupCopy to Clipboard Copied! Toggle word wrap Toggle overflow