12.4. 検証
Prometheus アラートが期待どおりに Webhook をトリガーすることをテストするには、次の手順を実行してスプリットブレインをシミュレートします。
各クラスターで以下を実行します。
コマンド:
oc -n openshift-operators scale --replicas=0 deployment/infinispan-operator-controller-manager oc -n openshift-operators rollout status -w deployment/infinispan-operator-controller-manager oc -n ${NAMESPACE} scale --replicas=0 deployment/infinispan-router oc -n ${NAMESPACE} rollout status -w deployment/infinispan-router
oc -n openshift-operators scale --replicas=0 deployment/infinispan-operator-controller-manager
1 oc -n openshift-operators rollout status -w deployment/infinispan-operator-controller-manager oc -n ${NAMESPACE} scale --replicas=0 deployment/infinispan-router
2 oc -n ${NAMESPACE} rollout status -w deployment/infinispan-router
Copy to Clipboard Copied! Toggle word wrap Toggle overflow -
Openshift コンソールの Observe
Alerting メニューを調べて、クラスターで SiteOffline
イベントが発生したことを確認します。 - AWS コンソールで Global Accelerator EndpointGroup を調べます。エンドポイントが 1 つだけ存在するはずです。
サイト間の接続を再確立するために、Data Grid Operator と Gossip Router をスケールアップします。
コマンド:
oc -n openshift-operators scale --replicas=1 deployment/infinispan-operator-controller-manager oc -n openshift-operators rollout status -w deployment/infinispan-operator-controller-manager oc -n ${NAMESPACE} scale --replicas=1 deployment/infinispan-router oc -n ${NAMESPACE} rollout status -w deployment/infinispan-router
oc -n openshift-operators scale --replicas=1 deployment/infinispan-operator-controller-manager oc -n openshift-operators rollout status -w deployment/infinispan-operator-controller-manager oc -n ${NAMESPACE} scale --replicas=1 deployment/infinispan-router
1 oc -n ${NAMESPACE} rollout status -w deployment/infinispan-router
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 1
${NAMESPACE}
を、Data Grid サーバーが含まれる namespace に置き換えます。
-
各サイトの
vendor_jgroups_site_view_status
メトリクスを調べます。値が1
の場合、サイトがアクセス可能であることを示します。 - 両方のエンドポイントが含まれるように Accelerator EndpointGroup を更新します。詳細は、サイトをオンラインにする の章を参照してください。