10.3. メンテナンス中にクラスターノードがオフラインであると報告される
たとえば HANA の更新などのためにクラスターに maintenance-mode が設定されている場合、ノード間の問題は引き続き検出されますが、回復アクションはまだトリガーされません。
このような状況に遭遇した場合は、メンテナンスモードを解除する前に、まず問題の原因を修正する必要があります。
例: 2 ノードクラスターでノード間の corosync 通信がブロックされている
両方のノードが他のノードを offline として報告します。このような状況で maintenance モードが削除されると、クラスターは 1 つのノードをフェンシングして回復を試みます。これは、進行中の HANA メンテナンスアクティビティーに重大な影響を及ぼす可能性があります。
...
*** Resource management is DISABLED ***
The cluster will not attempt to start, stop or recover services
Node List:
* Node hana1 (1): online, feature set 3.19.0
* Node hana2 (2): UNCLEAN (offline)
Full List of Resources:
* Clone Set: cln_SAPHanaTop_RH1_HDB02 [rsc_SAPHanaTop_RH1_HDB02] (maintenance):
* rsc_SAPHanaTop_RH1_HDB02 (ocf:heartbeat:SAPHanaTopology): Started hana2 (UNCLEAN, maintenance)
* rsc_SAPHanaTop_RH1_HDB02 (ocf:heartbeat:SAPHanaTopology): Started hana1 (maintenance)
* Clone Set: cln_SAPHanaCon_RH1_HDB02 [rsc_SAPHanaCon_RH1_HDB02] (promotable, maintenance):
* rsc_SAPHanaCon_RH1_HDB02 (ocf:heartbeat:SAPHanaController): Unpromoted hana2 (UNCLEAN, maintenance)
* rsc_SAPHanaCon_RH1_HDB02 (ocf:heartbeat:SAPHanaController): Promoted hana1 (maintenance)
* Clone Set: cln_SAPHanaFil_RH1_HDB02 [rsc_SAPHanaFil_RH1_HDB02] (maintenance):
* rsc_SAPHanaFil_RH1_HDB02 (ocf:heartbeat:SAPHanaFilesystem): Started hana2 (UNCLEAN, maintenance)
* rsc_SAPHanaFil_RH1_HDB02 (ocf:heartbeat:SAPHanaFilesystem): Started hana1 (maintenance)
* rsc_vip_RH1_HDB02_primary (ocf:heartbeat:IPaddr2): Started hana1 (maintenance)
* rsc_vip_RH1_HDB02_readonly (ocf:heartbeat:IPaddr2): Started hana2 (UNCLEAN, maintenance)
...
問題の根本原因を特定します。以下に例を示します。
- HANA メンテナンスと並行して行われる、クラスター通信接続の計画的なネットワークメンテナンス。
- ネットワークデバイスの障害か、オペレーティングシステムまたはネットワークレベルでの設定ミスによる、ネットワーク接続の予期しない停止。
- ファイアウォール設定により、クラスター通信ポートがブロックされる。
クラスターのメンテナンスが削除される際に、クラスターが復旧措置を講じることがないよう、問題をすべて修正します。