5.4. ERS 인스턴스 실패 테스트
ASCS 인스턴스의 enqueue 복제 서버(ERS)가 실패할 때 pacemaker 클러스터가 필요한 작업을 수행하는지 확인하려면 다음을 수행하십시오.
테스트 사전 조건
두 클러스터 노드 모두
ASCS및ERS실행의 리소스 그룹을 사용합니다.pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node2 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node1[root@node1]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node2 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node1Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 리소스 및 리소스 그룹에 대한 모든 오류가 삭제되고 failcount가 재설정되었습니다.
테스트 작업
-
ERS인스턴스가 실행 중인 노드에서 인큐 복제 서버 프로세스의 PID를 식별합니다. - 식별된 프로세스에 SIGKILL 신호를 보냅니다.
-
모니터링
테스트 중에 별도의 터미널에서 다음 명령을 실행합니다.
watch -n 1 pcs status
[root@node2]# watch -n 1 pcs statusCopy to Clipboard Copied! Toggle word wrap Toggle overflow
예상 동작
- 복제 서버 프로세스가 종료됩니다.Enqueue replication server process is killed.
-
Pacemaker 클러스터는 구성별로 필요한 작업을 수행합니다. 이 경우 동일한 노드에서
ERS인스턴스를 다시 시작합니다.
테스트
<
sid>adm사용자로 전환합니다.su - s4hadm
[root@node1]# su - s4hadmCopy to Clipboard Copied! Toggle word wrap Toggle overflow enqr.sap:의 PID를 식별합니다.node1:s4hadm 56> pgrep -af enqr.sap 532273 enqr.sapS4H_ERS29 pf=/usr/sap/S4H/SYS/profile/S4H_ERS29_s4ers
node1:s4hadm 56> pgrep -af enqr.sap 532273 enqr.sapS4H_ERS29 pf=/usr/sap/S4H/SYS/profile/S4H_ERS29_s4ersCopy to Clipboard Copied! Toggle word wrap Toggle overflow 식별된 프로세스를 종료합니다.
node1:s4hadm 58> kill -9 532273
node1:s4hadm 58> kill -9 532273Copy to Clipboard Copied! Toggle word wrap Toggle overflow 클러스터 "Failed Resource Actions"를 확인합니다.
pcs status | grep "Failed Resource Actions" -A1 Failed Resource Actions: * S4H_ers29 2m-interval monitor on node1 returned 'not running' at Thu Dec 7 13:15:02 2023
[root@node1]# pcs status | grep "Failed Resource Actions" -A1 Failed Resource Actions: * S4H_ers29 2m-interval monitor on node1 returned 'not running' at Thu Dec 7 13:15:02 2023Copy to Clipboard Copied! Toggle word wrap Toggle overflow ERS는 다른 노드에서 이미 실행중인ASCS를 방해하지 않고 동일한 노드에서 다시 시작합니다.pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node2 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node1 * S4H_ers29 2m-interval monitor on node1 returned 'not running' at Thu Dec 7 13:15:02 2023[root@node1]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node2 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node1 * S4H_ers29 2m-interval monitor on node1 returned 'not running' at Thu Dec 7 13:15:02 2023Copy to Clipboard Copied! Toggle word wrap Toggle overflow
복구 작업
실패한 작업을 지웁니다.
pcs resource cleanup S4H_ers29 … Waiting for 1 reply from the controller ... got reply (done)
[root@node1]# pcs resource cleanup S4H_ers29 … Waiting for 1 reply from the controller ... got reply (done)Copy to Clipboard Copied! Toggle word wrap Toggle overflow