第 9 章 配置线程池的概念
本节旨在了解如何为红帽构建的 Keycloak 配置线程池连接池的注意事项和最佳实践。对于应用此配置,请访问 使用红帽构建的 Keycloak Operator 部署红帽构建的 Keycloak for HA。
9.1. 概念
9.1.1. Quarkus executor 池
红帽构建的 Keycloak 请求以及阻塞探测由 executor 池处理。根据可用的 CPU 内核,它的最大大小为 50 个或更多线程。线程根据需要创建,并在不再需要时结束,因此系统将自动扩展和缩减。红帽构建的 Keycloak 允许通过 http-pool-max-threads
配置选项配置最大线程池大小。如需示例,请参阅使用红帽构建的 Keycloak Operator 部署红帽构建的 Keycloak for HA。
在 Kubernetes 上运行时,请调整 worker 线程数量,以避免产生比 pod 限制允许更多的负载,以避免节流,从而导致拥塞。在物理机上运行时,请调整 worker 线程数量,以避免比节点可以处理更多的负载,以避免拥塞。拥塞会导致响应时间较长,以及增加内存用量,最终导致系统不稳定。
理想情况下,您应该以较低的线程限制开始,并根据目标吞吐量和响应时间进行相应调整。当负载和线程数量增加时,数据库连接也会成为瓶颈。当请求无法在 5 秒内获取数据库连接后,其日志中会失败,并显示 Unable to acquire JDBC Connection
等消息。调用者将收到带有 5xx HTTP 状态代码代表服务器端错误的响应。
如果您增加数据库连接的数量和线程数量过多,则系统将处于高负载下,导致性能不佳。数据库连接的数量分别通过 Database
settings db-pool-initial-size
、db-pool-min-size
和 db-pool-max-size
来配置。低数字确保所有客户端的快速响应时间,即使负载激增有时有请求失败。
9.1.2. JGroups 连接池
目前仅适用于单站点设置。在具有外部 Data Grid 的多站点设置中,这不再有限制。
集群中所有红帽构建的 Keycloak 节点构建中的 executor 线程数量不应超过 JGroups 线程池中可用线程数量,以避免 org.jgroups.util.ThreadPool: 线程池已满
错误。要查看第一次发生错误,系统属性 jgroups.thread_dumps_threshold
需要设为 1
,否则消息仅在 10000 请求被拒绝后才会出现。
JGroup 线程数量默认为 200
。虽然可以使用 Java 系统属性 jgroups.thread_pool.max_threads
进行配置,但我们建议将其保持在此值中。如试验所示,集群中 Quarkus worker 线程总数不能超过每个节点的 JGroup 线程池中的线程数量,以避免 JGroups 通信中的死锁。如果红帽构建的 Keycloak 集群带有四个 Pod,则每个 Pod 应该有 50 Quarkus worker 线程。使用红帽构建的 Keycloak 配置选项 http-pool-max-threads
来配置 Quarkus worker 线程的最大数量。
使用指标来监控池中的总 JGroup 线程,以及池中活跃的线程。当使用 TCP 作为 JGroups 传输协议时,指标 vendor_jgroups_tcp_get_thread_pool_size
和 vendor_jgroups_tcp_get_thread_pool_size_active
可用于监控。使用 UDP 时,指标 vendor_jgroups_udp_get_thread_pool_size
和 vendor_jgroups_udp_get_thread_pool_size_active
可用。这可用于监控限制 Quarkus 线程池大小,将活跃 JGroup 线程的数量保留在最大 JGroup 线程池大小下。
9.1.3. Load Shedding
默认情况下,红帽构建的 Keycloak 将无限地将所有传入的请求排队,即使请求处理停止也是如此。这将在 Pod 中使用额外的内存,可能会耗尽负载均衡器中的资源,请求最终会在客户端一侧超时,而无需了解请求是否已被处理。要限制红帽构建的 Keycloak 中排队请求数,请设置额外的 Quarkus 配置选项。
配置 http-max-queued-requests
,以指定在超过此队列大小后有效的负载均衡的最大队列长度。假设红帽构建的 Keycloak Pod 进程每秒约 200 个请求,则队列为 1000 会导致最大等待时间为 5 秒。
当此设置处于活跃状态时,超过排队请求数的请求将返回 HTTP 503 错误。Red Hat build of Keycloak 会在日志中记录错误消息。
9.1.4. probes
Red Hat build of Keycloak 的存活度探测是非阻止的,以避免在高负载下重启 Pod。
在一些情况下,整个健康探测和就绪度探测可能会检查与数据库的连接,因此它们可能会在高负载下失败。因此,Pod 可能会在高负载下变为未就绪。
9.1.5. OS 资源
为了使 Java 创建线程,在 Linux 上运行时,它需要有文件句柄。因此,打开的文件数量(如 ulimit -n
on Linux)需要为红帽构建的 Keycloak 提供头空间,以增加所需的线程数量。每个线程也会消耗内存,容器内存限值需要设置为允许此的值,或 Pod 将被 Kubernetes 终止。