5.6. 노드 충돌로 인한 ERS 인스턴스 실패
동일한 노드에서 ERS 인스턴스가 다시 시작되었는지 확인하려면 다음을 수행합니다.
테스트 사전 조건
두 클러스터 노드 모두
ASCS및ERS실행의 리소스 그룹을 사용합니다.pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node1 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node2[root@node1]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node1 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node2Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 리소스 및 리소스 그룹에 대한 모든 오류가 삭제되고 failcount가 재설정되었습니다.
테스트 작업
-
ERS가 실행 중인 노드를 충돌합니다.
-
모니터링
테스트 중에 다른 노드의 별도의 터미널에서 다음 명령을 실행합니다.
watch -n 1 pcs status
[root@nod1]# watch -n 1 pcs statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow
예상 동작
-
ERS가 실행 중인 노드가 충돌하고 구성별로 종료되면 종료되거나 다시 시작됩니다. -
한편
ASCS는 다른 노드로 계속 실행됩니다.ERS가 다시 온라인 상태가 되면 충돌이 발생한 노드에서 다시 시작됩니다.
-
테스트
ERS가 실행 중인 노드에서 root 사용자로 다음 명령을 실행합니다.echo c > /proc/sysrq-trigger
[root@node2]# echo c > /proc/sysrq-triggerCopy to Clipboard Copied! Toggle word wrap Toggle overflow ERS는 테스트 전체에서ASCS인스턴스를 방해하지 않고 다시 온라인 상태가 되면 충돌이 발생한 노드에서 다시 시작됩니다.pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node1 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node2[root@node1]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node1 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node2Copy to Clipboard Copied! Toggle word wrap Toggle overflow
복구 작업
다음과 같은 경우 실패한 작업을 정리합니다.
pcs resource cleanup
[root@node2]# pcs resource cleanupCopy to Clipboard Copied! Toggle word wrap Toggle overflow