14.4. 検証
Prometheus アラートが期待どおりに Webhook をトリガーすることをテストするには、次の手順を実行してスプリットブレインをシミュレートします。
各クラスターで以下を実行します。
コマンド:
oc -n openshift-operators scale --replicas=0 deployment/infinispan-operator-controller-manager 1 oc -n openshift-operators rollout status -w deployment/infinispan-operator-controller-manager oc -n ${NAMESPACE} scale --replicas=0 deployment/infinispan-router 2 oc -n ${NAMESPACE} rollout status -w deployment/infinispan-router
-
Openshift コンソールの Observe
Alerting メニューを調べて、クラスターで SiteOffline
イベントが発生したことを確認します。 - AWS コンソールで Global Accelerator EndpointGroup を調べます。エンドポイントが 1 つだけ存在するはずです。
サイト間の接続を再確立するために、Data Grid Operator と Gossip Router をスケールアップします。
コマンド:
oc -n openshift-operators scale --replicas=1 deployment/infinispan-operator-controller-manager oc -n openshift-operators rollout status -w deployment/infinispan-operator-controller-manager oc -n ${NAMESPACE} scale --replicas=1 deployment/infinispan-router 1 oc -n ${NAMESPACE} rollout status -w deployment/infinispan-router
- 1
${NAMESPACE}
を、Data Grid サーバーが含まれる namespace に置き換えます。
-
各サイトの
vendor_jgroups_site_view_status
メトリクスを調べます。値が1
の場合、サイトがアクセス可能であることを示します。 - 両方のエンドポイントが含まれるように Accelerator EndpointGroup を更新します。詳細は、サイトをオンラインにする の章を参照してください。