5.5. 노드 충돌로 인한 ASCS 인스턴스 장애 조치
노드 충돌 시 ASCS 인스턴스가 올바르게 이동하는지 확인하려면 다음을 수행하십시오.
테스트 사전 조건
두 클러스터 노드 모두
ASCS및ERS실행의 리소스 그룹을 사용합니다.pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node2 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node1[root@node1]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node2 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node1Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 리소스 및 리소스 그룹에 대한 모든 오류가 삭제되고 failcount가 재설정되었습니다.
테스트 작업
-
ASCS가 실행 중인 노드를 충돌합니다.
-
모니터링
테스트 중에 다른 노드의 별도의 터미널에서 다음 명령을 실행합니다.
watch -n 1 pcs status
[root@node1]# watch -n 1 pcs statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow
예상 동작
-
ASCS가 실행 중인 노드가 충돌하고 구성별로 종료되면 종료되거나 다시 시작됩니다. -
한편
ASCS는 다른 노드로 이동합니다. -
ERS는 다시 온라인 상태가 된 후 이전에 충돌한 노드에서 시작됩니다.
-
테스트
ASCS가 실행 중인 노드에서 root 사용자로 다음 명령을 실행합니다.echo c > /proc/sysrq-trigger
[root@node2]# echo c > /proc/sysrq-triggerCopy to Clipboard Copied! Toggle word wrap Toggle overflow ASCS는 다른 노드로 이동합니다.pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node1 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node1[root@node1]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node1 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node1Copy to Clipboard Copied! Toggle word wrap Toggle overflow ERS는 온라인 상태가 되면 이전에 중단된 노드를 중지하고 이동합니다.Copy to Clipboard Copied! Toggle word wrap Toggle overflow
복구 작업
다음과 같은 경우 실패한 작업을 정리합니다.
pcs resource cleanup
[root@node1]# pcs resource cleanupCopy to Clipboard Copied! Toggle word wrap Toggle overflow