5.4. ERS インスタンスのテストの失敗
ASCS インスタンスのエンキューレプリケーションサーバー (ERS) に障害が発生したときに、pacemaker クラスターが必要なアクションを実行することを確認します。
テストの前提条件
両方のクラスターノードが稼働しており、
ASCSとERSのリソースグループが実行されています。[root@node1]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node2 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node1- リソースおよびリソースグループのすべての障害がクリアされ、failcount がリセットされている。
テストの手順
-
ERSインスタンスが実行されているノードのエンキューレプリケーションサーバープロセスの PID を特定します。 - 識別されたプロセスに SIGKILL シグナルを送信します。
-
モニタリング
テスト中に別のターミナルで次のコマンドを実行します。
[root@node2]# watch -n 1 pcs status
予想される動作
- エンキューレプリケーションサーバープロセスが強制終了します。
-
Pacemaker クラスターは、設定に従って必要なアクションを実行します。この場合、同じノード上で
ERSインスタンスを再起動します。
テスト
<sid>admユーザーに切り替えます。[root@node1]# su - s4hadmenqr.sapの PID を特定します。node1:s4hadm 56> pgrep -af enqr.sap 532273 enqr.sapS4H_ERS29 pf=/usr/sap/S4H/SYS/profile/S4H_ERS29_s4ers特定されたプロセスを強制終了します。
node1:s4hadm 58> kill -9 532273クラスターの “Failed Resource Actions“ に注目してください。
[root@node1]# pcs status | grep "Failed Resource Actions" -A1 Failed Resource Actions: * S4H_ers29 2m-interval monitor on node1 returned 'not running' at Thu Dec 7 13:15:02 2023ERSは、他のノードですでに実行されているASCSを妨げることなく、同じノードで再起動します。[root@node1]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node2 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node1 * S4H_ers29 2m-interval monitor on node1 returned 'not running' at Thu Dec 7 13:15:02 2023
復元の手順
失敗したアクションをクリアします。
[root@node1]# pcs resource cleanup S4H_ers29 … Waiting for 1 reply from the controller ... got reply (done)