5.7. 因为节点崩溃而导致 ASCS 实例失败(ENSA2)
对于 3 个节点 ENSA 2 集群环境,在任何实例的故障转移事件中考虑第三个节点。
测试先决条件
-
一个 3 个节点 SAP S/4HANA 集群,其中包含运行
ASCS
和ERS
的资源组。 - 第三节点可以访问所有文件系统,并可置备所需的实例特定 IP 地址,方式与前 2 个节点相同。
在示例设置中,底层共享
NFS
文件系统如下:Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 已清除资源和资源组的所有故障,并且已重置故障计数。
-
一个 3 个节点 SAP S/4HANA 集群,其中包含运行
测试步骤
-
崩溃运行
ASCS
的节点。
-
崩溃运行
监控
在当前在测试过程中没有运行
ASCS
组的节点中的一个单独的终端中运行以下命令:watch -n 1 pcs status
[root@node2]# watch -n 1 pcs status
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
预期行为
-
ASCS
移至第 3 个节点。 -
ERS
继续在运行它的同一节点上运行。
-
测试
崩溃当前运行
ASCS
组的节点:echo c > /proc/sysrq-trigger
[root@node1]# echo c > /proc/sysrq-trigger
Copy to Clipboard Copied! Toggle word wrap Toggle overflow ASCS
移至第 3 个节点,而不干扰已在第 2 个节点上运行的ERS
实例:pcs status | egrep -e "S4H_ascs20|S4H_ers29"
[root@node2]# pcs status | egrep -e "S4H_ascs20|S4H_ers29" * S4H_ascs20 (ocf:heartbeat:SAPInstance): Started node3 * S4H_ers29 (ocf:heartbeat:SAPInstance): Started node2
Copy to Clipboard Copied! Toggle word wrap Toggle overflow
恢复过程
如果出现以下情况,清理失败的操作:
pcs resource cleanup
[root@node2]# pcs resource cleanup
Copy to Clipboard Copied! Toggle word wrap Toggle overflow