18.5. 중요한 Kafka 브로커 메트릭


Kafka는 Kafka 클러스터에서 브로커의 성능을 모니터링하기 위해 많은 10.0.0.1을 제공합니다. 이는 전체 클러스터가 아닌 개별 브로커에 적용됩니다.

다음 표에서는 서버, 네트워크, 로깅 및 컨트롤러 메트릭으로 구성된 이러한 브로커 수준 CloudEvent를 선택할 수 있습니다.

18.5.1. Kafka 서버 지표

다음 표는 Kafka 서버에 대한 정보를 보고하는 다양한 메트릭을 보여줍니다.

표 18.2. Kafka 서버의 지표
메트릭CloudEvent설명예상 값

초당 메시지

kafka.server:type=BrokerTopicMetrics,name=MessagesInPerSec

브로커가 개별 메시지를 사용하는 비율입니다.

클러스터의 다른 브로커와 대략 동일합니다.

초당 바이트 수

kafka.server:type=BrokerTopicMetrics,name=BytesInPerSec

브로커가 생산자에서 보낸 데이터를 사용하는 비율입니다.

클러스터의 다른 브로커와 대략 동일합니다.

초당 복제 바이트 수

kafka.server:type=BrokerTopicMetrics,name=ReplicationBytesInPerSec

다른 브로커에서 전송된 데이터는 추적자 브로커에 의해 소비됩니다.

해당 없음

초당 바이트 수

kafka.server:type=BrokerTopicMetrics,name=BytesOutPerSec

소비자가 데이터를 가져와서 브로커에서 읽는 비율입니다.

해당 없음

초당 만료 바이트 수입니다.

kafka.server:type=BrokerTopicMetrics,name=ReplicationBytesOutPerSec

데이터가 브로커에서 다른 브로커로 전송되는 비율입니다. 이 메트릭은 브로커가 파티션 그룹의 리더인지 모니터링하는 데 유용합니다.

해당 없음

복제 대상 파티션

kafka.server:type=ReplicaManager,name=UnderReplicatedPartitions

후속 복제본에서 완전히 복제되지 않은 파티션 수입니다.

Zero

최소 ISR 파티션 수

kafka.server:type=ReplicaManager,name=UnderMinIsrPartitionCount

최소 IISR(In-Sync Replica) 수에 따른 파티션 수입니다. ISR 개수는 리더와 최신 복제본 세트를 나타냅니다.

Zero

파티션 수

kafka.server:type=ReplicaManager,name=PartitionCount

브로커의 파티션 수입니다.

약은 다른 브로커와 비교할 때 발생합니다.

리더 수

kafka.server:type=ReplicaManager,name=LeaderCount

이 브로커가 리더인 복제본 수입니다.

클러스터의 다른 브로커와 대략 동일합니다.

ISR은 초당 축소

kafka.server:type=ReplicaManager,name=IsrShrinksPerSec

브로커의 ISR 수가 감소하는 속도

Zero

ISR은 초당 확장

kafka.server:type=ReplicaManager,name=IsrExpandsPerSec

브로커의 ISR 수가 증가하는 비율입니다.

Zero

최대 지연

kafka.server:type=ReplicaFetcherManager,name=MaxLag,clientId=Replica

리더 복제본과 후속 복제본에서 메시지를 수신하는 시간 사이의 최대 지연입니다.

생성 요청의 최대 배치 크기에 비례합니다.

프로듀서의 요청

kafka.server:type=DelayedOperationPurgatory,name=PurgatorySize,delayedOperation=Produce

프로듀서의 전송 요청 수입니다.

해당 없음

요청 in fetch purgatory

kafka.server:type=DelayedOperationPurgatory,name=PurgatorySize,delayedOperation=Fetch

가져오기 정리의 가져오기 요청 수입니다.

해당 없음

요청 처리기 평균 유휴 상태 백분율

kafka.server:type=KafkaRequestHandlerPool,name=RequestHandlerAvgIdlePercent

요청 처리기 (IO) 스레드가 사용되지 않는 시간의 백분율을 나타냅니다.Indicates the percentage of time that the request handler (IO) threads are not in use.

값이 낮으면 브로커의 워크로드가 높습니다.

요청 (Requests exclude from throttling)

kafka.server:type=Request

제한에서 제외되는 요청 수입니다.

해당 없음

zookeeper 요청 대기 시간(밀리초)

kafka.server:type=ZooKeeperClientMetrics,name=ZooKeeperRequestLatencyMs

브로커의 ZooKeeper 요청에 대한 대기 시간(밀리초)입니다.

해당 없음

zookeeper 세션 상태

kafka.server:type=SessionExpireListener,name=SessionState

브로커에 대한 연결 상태를 ZooKeeper로 설정합니다.

연결

18.5.2. Kafka 네트워크 지표

다음 표에서는 요청에 대한 정보를 보고하는 메트릭 선택 방법을 보여줍니다.

메트릭CloudEvent설명예상 값

초당 요청 수

Kafka.network:type=RequestMetrics,name=RequestsPerSec,request={Produce|FetchConsumer|FetchFollower}

초당 요청 유형에 대한 총 요청 수입니다. Produce,FetchConsumer, Fetch follower 요청 유형에는 각각 고유한ECDHEs가 있습니다.

해당 없음

요청 바이트(바이트 단위 요청 크기)

kafka.network:type=RequestMetrics,name=RequestBytes,request=([-.\w]+)

요청 속성으로 식별되는 요청 유형에 대해 이루어진 요청 크기(바이트)입니다. 사용 가능한 모든 요청 유형에 대해 별도의>-<이 RequestBytes 노드에 나열됩니다.

해당 없음

임시 메모리 크기(바이트 단위)

kafka.network:type=RequestMetrics,name=TemporaryMemoryBytes,request={Produce|Fetch}

메시지 형식 변환 및 메시지 압축 해제에 사용되는 임시 메모리 양입니다.

해당 없음

메시지 변환 시간

kafka.network:type=RequestMetrics,name=MessageConversionsTimeMs,request={Produce|Fetch}

메시지 형식을 변환하는 데 소비되는 시간(밀리초)입니다.

해당 없음

총 요청 시간(밀리초)

Kafka.network:type=RequestMetrics,name=TotalTimeMs,request={Produce|FetchConsumer|FetchFollower}

요청을 처리하는 데 소비된 총 시간(밀리초)입니다.

해당 없음

요청 대기열 시간(밀리초)

Kafka.network:type=RequestMetrics,name=RequestQueueTimeMs,request={Produce|FetchConsumer|FetchFollower}

요청에서 현재 요청 속성에 지정된 요청 유형에 대한 큐에서 현재 사용하는 시간(밀리초)입니다.

해당 없음

시간(leader 로컬 처리 시간)(밀리초)

Kafka.network:type=RequestMetrics,name=LocalTimeMs,request={Produce|FetchConsumer|FetchFollower}

리더가 요청을 처리하는 데 걸리는 시간(밀리초)입니다.

해당 없음

밀리초 단위 원격 시간(leader remote processing time)

Kafka.network:type=RequestMetrics,name=RemoteTimeMs,request={Produce|FetchConsumer|FetchFollower}

요청이 후속 조치를 기다리는 시간(밀리초)입니다. 사용 가능한 모든 요청 유형에 대해 별도의 CloudEvent가 RemoteTimeMs 노드에 나열됩니다.

해당 없음

응답 대기열 시간(밀리초)

Kafka.network:type=RequestMetrics,name=ResponseQueueTimeMs,request={Produce|FetchConsumer|FetchFollower}

요청이 응답 큐에서 대기하는 시간(밀리초)입니다.

해당 없음

응답 전송 시간(밀리초)

Kafka.network:type=RequestMetrics,name=ResponseSendTimeMs,request={Produce|FetchConsumer|FetchFollower}

응답을 보내는 데 걸리는 시간(밀리초)입니다.

해당 없음

네트워크 프로세서 평균 유휴 상태 백분율

kafka.network:type=SocketServer,name=NetworkProcessorAvgIdlePercent

네트워크 프로세서가 유휴 상태인 시간의 평균 백분율입니다.

0에서 1 사이입니다.

18.5.3. Kafka 로그 메트릭

다음 표에서는 로깅에 대한 정보를 보고하는 다양한 메트릭을 보여줍니다.

메트릭CloudEvent설명예상 값

플러시 속도 및 시간(밀리초)

kafka.log:type=LogFlushStats,name=LogFlushRateAndTimeMs

로그 데이터가 디스크에 기록되는 속도(밀리초)입니다.

해당 없음

오프라인 로그 디렉터리 수

kafka.log:type=LogManager,name=OfflineLogDirectoryCount

오프라인 로그 디렉터리 수(예: 하드웨어 장애 발생).

Zero

18.5.4. Kafka 컨트롤러 메트릭

다음 표에서는 클러스터 컨트롤러에 대한 정보를 보고하는 다양한 메트릭을 보여줍니다.

메트릭CloudEvent설명예상 값

활성 컨트롤러 수

kafka.controller:type=KafkaController,name=ActiveControllerCount

컨트롤러로 지정된 브로커 수입니다.

하나는 브로커가 클러스터의 컨트롤러임을 나타냅니다.

리더 선택 속도 및 시간(밀리초)

kafka.controller:type=ControllerStats,name=LeaderElectionRateAndTimeMs

새 리더 복제본이 선택된 비율입니다.

Zero

18.5.5. CloudEvent 메트릭

속도 또는 시간을 나타내는 메트릭은 10.0.0.1 메트릭으로 제공됩니다. 10.0.0.1 메트릭을 사용하는 CloudEvent의 클래스 이름 앞에 com.yammer.metrics 가 있습니다.

iPXE 속도 메트릭에는 요청 모니터링에 대해 다음과 같은 속성이 있습니다.

  • 수량
  • eventType (Bytes)
  • FifteenMinuteRate
  • RateUnit (Seconds)
  • MeanRate
  • OneMinuteRate
  • FiveMinuteRate

iPXE 시간 메트릭에는 요청 모니터링에 대해 다음과 같은 속성이 있습니다.

  • 최대
  • min
  • mean
  • StdDev
  • 75/95/98/99/99.9th Percentile
Red Hat logoGithubRedditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

© 2024 Red Hat, Inc.