4.9. 最小化重新平衡的影响
在组中活跃消费者间重新平衡分区是进行以下所需的时间:
- 消费者提交其偏移
- 要形成的新消费者组
- 为组成员分配分区的组领导者
- 组中的消费者,接收其分配并开始获取
重新平衡过程可能会增加服务的停机时间,特别是在消费者组集群滚动重启后重复发生时。
在这种情况下,您可以通过为组中的每个消费者实例分配唯一标识符(group.instance.id)来引入 静态成员资格。静态成员资格使用持久性,以便在会话超时后重启过程中识别消费者实例。因此,消费者维护其主题分区的分配,从而减少在故障或重启后重新加入组时不必要的重新平衡。
另外,调整 max.poll.interval.ms 配置可能会阻止由延长的处理任务导致的重新平衡,允许您指定对新消息的轮询之间的最大间隔。使用 max.poll.records 属性在每个轮询期间从消费者缓冲区返回的记录数上限。减少记录数量可让消费者更有效地处理较少的消息。如果冗长的消息处理不可避免,请考虑将此类任务卸载到 worker 线程池。这种并行处理方法可防止因为大量记录的消费者造成延迟和潜在的重新平衡。
# ...
group.instance.id=UNIQUE-ID
max.poll.interval.ms=300000
max.poll.records=500
# ...