第 5 章 使用指标进行故障排除
使用指标对错误和性能问题进行故障排除。
对于运行红帽构建的 Keycloak 部署,务必要了解系统如何执行以及是否满足您的服务级别目标(SLO)。有关 SLO 的详情,请使用服务级别指示器继续监控性能。
本指南将提供回答问题的指示:"当不满足 SLO 时,我该怎么做?"
Red Hat build of Keycloak 由多个组件组成,其中其中一个组件可能会将您的服务级别指示器移到不正常的数字中。
以下示例中演示了本指南提供的指导:
观察: 不满足延迟服务级别目标。
指示问题的指标 :
- 红帽构建的 Keycloak 的数据库连接池通常会耗尽,有线程排队来从池中检索连接。
-
红帽构建的 Keycloak
的用户
缓存命中率低于 5%。这意味着只有 20 个用户搜索可以从缓存中获取用户数据,其余则需要从数据库中加载它。
建议可能的缓解方案:
-
将用户
缓存大小增加到更高数字,这会减少对数据库的读取数量。 - 增加连接池中的连接数量。这将需要检查您的数据库的指标,并将其调优为更高的负载,例如通过增加可用处理器的数量。
注意
- 本指南重点介绍红帽构建的 Keycloak 指标。数据库本身故障排除不超出范围。
- 本指南提供常规指导。您应该始终通过将问题的指标与旧配置和新配置进行比较来确认配置更改。
注意
以下指标的 Grafana 仪表板可在仪表板中 可视化活动 一章中找到。
5.1. 红帽构建的 Keycloak 密钥指标列表 复制链接链接已复制到粘贴板!
复制链接链接已复制到粘贴板!
- 自我提供的指标
- JVM 指标
- 数据库指标
- HTTP 指标
单一站点指标(没有外部 Data Grid)
多站点指标(如多站点部署中所述)