14.4. 验证


要测试 Prometheus 警报是否会如预期触发 Webhook,请执行以下步骤来模拟脑裂:

  1. 在每个集群中执行以下操作:

    命令:

    oc -n openshift-operators scale --replicas=0 deployment/infinispan-operator-controller-manager 1
    oc -n openshift-operators rollout status -w deployment/infinispan-operator-controller-manager
    oc -n ${NAMESPACE} scale --replicas=0 deployment/infinispan-router 2
    oc -n ${NAMESPACE} rollout status -w deployment/infinispan-router

    1
    缩减 Data Grid Operator,以便下一步不会导致操作器重新创建部署
    2
    使用包含 Data Grid 服务器的命名空间缩减 Gossip Router deployment.Replace ${NAMESPACE}
  2. 通过检查 Openshift 控制台中的 Observe Alerting 菜单来验证集群中是否已触发 SiteOffline 事件
  3. 检查 AWS 控制台中的 Global Accelerator EndpointGroup,且只有一个端点
  4. 扩展 Data Grid Operator 和 Gossip Router,以在站点间重新建立连接:

    命令:

    oc -n openshift-operators scale --replicas=1 deployment/infinispan-operator-controller-manager
    oc -n openshift-operators rollout status -w deployment/infinispan-operator-controller-manager
    oc -n ${NAMESPACE} scale --replicas=1 deployment/infinispan-router 1
    oc -n ${NAMESPACE} rollout status -w deployment/infinispan-router

    1
    ${NAMESPACE} 替换为包含 Data Grid 服务器的命名空间
  5. 检查每个站点中的 vendor_jgroups_site_view_status 指标。值 1 表示站点可以访问。
  6. 更新加速器 EndpointGroup,使其包含两个端点。详情请参阅 Bring site online 章节。
Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.