18.5. 重要的 Kafka 代理指标


Kafka 提供很多 MBeans 来监控 Kafka 集群中的代理性能。它们应用到单独的代理,而不是整个集群。

下表显示这些代理级别的 MBeans 整理到服务器、网络、日志记录和控制器指标中。

18.5.1. Kafka 服务器指标

下表显示了报告 Kafka 服务器相关信息的指标。

Expand
表 18.2. Kafka 服务器的指标
指标MBean描述预期值

每秒的消息

kafka.server:type=BrokerTopicMetrics,name=MessagesInPerSec

代理消耗单个消息的速率。

与集群中的其他代理相同。

每秒字节数

kafka.server:type=BrokerTopicMetrics,name=BytesInPerSec

代理使用从生产者发送的数据的速度。

与集群中的其他代理相同。

每秒复制字节数

kafka.server:type=BrokerTopicMetrics,name=ReplicationBytesInPerSec

通过后续程序代理使用其他代理数据的速度。

N/A

每秒字节数

kafka.server:type=BrokerTopicMetrics,name=BytesOutPerSec

用户从代理获取数据的速度。

N/A

复制字节数(每秒复制)

kafka.server:type=BrokerTopicMetrics,name=ReplicationBytesOutPerSec

从代理发送到其他代理的数据率。此指标可用于监控代理是一组分区的领导人。

N/A

under-replicated 分区

kafka.server:type=ReplicaManager,name=UnderReplicatedPartitions

后续副本中尚未完全复制的分区数量。

至少 ISR 分区数

kafka.server:type=ReplicaManager,name=UnderMinIsrPartitionCount

最小 In-Sync Replica (ISR)计数下的分区数量。ISR 计数表示一组与领导同步的副本数。

分区计数

kafka.server:type=ReplicaManager,name=PartitionCount

代理中的分区数量。

即使与其它代理进行比较,也大约是。

领导计数

kafka.server:type=ReplicaManager,name=LeaderCount

此代理为领导的副本数。

与集群中的其他代理相同。

ISR 减少每秒的缩小

kafka.server:type=ReplicaManager,name=IsrShrinksPerSec

代理中 ISRs 数量的速率会减少

ISR 每秒扩展

kafka.server:type=ReplicaManager,name=IsrExpandsPerSec

代理中 ISR 的数量会增加率。

最大 lag

kafka.server:type=ReplicaFetcherManager,name=MaxLag,clientId=Replica

在领导副本接收消息由领导副本和后续副本接收的时间之间的最大滞后。

与生成请求的最大批处理大小成比例。

制作者中的请求

kafka.server:type=DelayedOperationPurgatory,name=PurgatorySize,delayedOperation=Produce

制作者类别中的发送请求数量。

N/A

获取请求

kafka.server:type=DelayedOperationPurgatory,name=PurgatorySize,delayedOperation=Fetch

获取请求的数量。

N/A

请求处理器平均闲置百分比

kafka.server:type=KafkaRequestHandlerPool,name=RequestHandlerAvgIdlePercent

表示请求处理程序(IO)线程没有使用的时间百分比。

较低值表示代理的工作负载高。

请求(请求免于节流)

kafka.server:type=Request

免于节流的请求数。

N/A

zookeeper 请求延迟(以毫秒为单位)

kafka.server:type=ZooKeeperClientMetrics,name=ZooKeeperRequestLatencyMs

ZooKeeper 请求的延迟,以毫秒为单位。

N/A

zookeeper 会话状态

kafka.server:type=SessionExpireListener,name=SessionState

代理与 ZooKeeper 连接的状态。

已连接

18.5.2. Kafka 网络指标

下表显示了报告有关请求信息的指标。

Expand
指标MBean描述预期值

每秒请求数

kafka.network:type=RequestMetrics,name=RequestsPerSec,request={Produce|FetchConsumer|FetchFollower}

请求类型每秒发出的请求总数。ProduceFetchConsumerFetchFollower 请求类型各自都有自己的 MBeans。

N/A

请求字节数(以字节为单位)

kafka.network:type=RequestMetrics,name=RequestBytes,request=([-.\w]+)

MBean 名称的 request 属性标识的请求类型(以字节为单位)发出的请求大小。所有可用请求类型的独立的 MBeans 列在 RequestBytes 节点中。

N/A

临时内存大小(以字节为单位)

kafka.network:type=RequestMetrics,name=TemporaryMemoryBytes,request={Produce|Fetch}

用于转换消息格式和解压缩消息的临时内存量。

N/A

消息转换时间

kafka.network:type=RequestMetrics,name=MessageConversionsTimeMs,request={Produce|Fetch}

转换消息格式的时间(以毫秒为单位)。

N/A

请求时间总数(以毫秒为单位)

kafka.network:type=RequestMetrics,name=TotalTimeMs,request={Produce|FetchConsumer|FetchFollower}

处理请求的总时间(以毫秒为单位)。

N/A

请求队列时间(毫秒)

kafka.network:type=RequestMetrics,name=RequestQueueTimeMs,request={Produce|FetchConsumer|FetchFollower}

请求当前在 request 属性中给定的请求类型的时间(以毫秒为单位)。

N/A

本地时间(领导本地处理时间)以毫秒为单位

kafka.network:type=RequestMetrics,name=LocalTimeMs,request={Produce|FetchConsumer|FetchFollower}

处理请求的领导时间(以毫秒为单位)。

N/A

远程时间(领导远程处理时间)以毫秒为单位

kafka.network:type=RequestMetrics,name=RemoteTimeMs,request={Produce|FetchConsumer|FetchFollower}

请求等待后续时间长度(以毫秒为单位)。RemoteTimeMs 节点下列出了所有可用请求类型的单独的 MBeans。

N/A

响应队列时间(毫秒)

kafka.network:type=RequestMetrics,name=ResponseQueueTimeMs,request={Produce|FetchConsumer|FetchFollower}

请求在响应队列中等待的时间长度(以毫秒为单位)。

N/A

以毫秒为单位响应发送时间

kafka.network:type=RequestMetrics,name=ResponseSendTimeMs,request={Produce|FetchConsumer|FetchFollower}

发送响应的时间(以毫秒为单位)。

N/A

网络处理器平均空闲

kafka.network:type=SocketServer,name=NetworkProcessorAvgIdlePercent

网络处理器空闲时间的平均百分比。

介于零到一之间.

18.5.3. Kafka 日志指标

下表显示了报告有关日志记录信息的指标。

Expand
指标MBean描述预期值

日志刷新率和时间(以毫秒为单位)

kafka.log:type=LogFlushStats,name=LogFlushRateAndTimeMs

日志数据写入磁盘的速率,以毫秒为单位。

N/A

离线日志目录计数

kafka.log:type=LogManager,name=OfflineLogDirectoryCount

离线日志目录数量(例如,在硬件故障后)。

18.5.4. Kafka 控制器指标

下表显示了报告关于集群控制器的信息的指标。

Expand
指标MBean描述预期值

活跃控制器计数

kafka.controller:type=KafkaController,name=ActiveControllerCount

指定为控制器的代理数量。

一个表示代理是集群的控制器。

领导选举率和时间(以毫秒为单位)

kafka.controller:type=ControllerStats,name=LeaderElectionRateAndTimeMs

选择新领导副本的速率。

18.5.5. Yammer 指标

代表率或单位的指标以 Yammer 指标形式提供。使用 Yammer 指标的 MBean 类名称前缀为 com.yammer.metrics

Yammer 速率的指标具有以下属性用于监控请求:

  • 数量
  • EventType (Bytes)
  • FifteenMinuteRate
  • RateUnit (Seconds)
  • MeanRate
  • OneMinuteRate
  • FiveMinuteRate

Yammer 时间指标具有以下属性用于监控请求:

  • Max
  • Min
  • mean
  • StdDev
  • 75/95/98/99/99.9th Percentile
Red Hat logoGithubredditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。 了解我们当前的更新.

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

Theme

© 2026 Red Hat
返回顶部