5.5. ノードのクラッシュによる ASCS インスタンスのフェイルオーバー
ノードがクラッシュした場合に ASCS
インスタンスが正しく移動することを確認します。
テストの前提条件
両方のクラスターノードが稼働しており、
ASCS
とERS
のリソースグループが実行されています。[root@node1]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node2 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node1
- リソースおよびリソースグループのすべての障害がクリアされ、failcount がリセットされている。
テストの手順
-
ASCS
が実行されているノードをクラッシュします。
-
モニタリング
テスト中に、他のノードの別のターミナルで次のコマンドを実行します。
[root@node1]# watch -n 1 pcs status
予想される動作
-
ASCS
が実行されているノードがクラッシュし、設定に従ってシャットダウンまたは再起動されます。 -
その間、
ASCS
は他のノードに移動します。 -
ERS
は、以前にクラッシュしたノードがオンラインに戻った後、そのノード上で起動します。
-
テスト
ASCS
が実行されているノードで、root ユーザーとして次のコマンドを実行します。[root@node2]# echo c > /proc/sysrq-trigger
ASCS
は他のノードに移動します。[root@node1]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node1 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node1
ERS
は停止し、オンラインに戻ると以前にクラッシュしたノードに移動します。[root@node1]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node1 * S4H_ers29 (ocf:heartbeat:SAPInstance): Stopped [root@node1]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node1 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node2
復元の手順
失敗したアクションがある場合はクリーンアップします。
[root@node1]# pcs resource cleanup