18.5. 중요한 Kafka 브로커 메트릭
Kafka는 Kafka 클러스터에서 브로커의 성능을 모니터링하기 위해 많은 10.0.0.1을 제공합니다. 이는 전체 클러스터가 아닌 개별 브로커에 적용됩니다.
다음 표에서는 서버, 네트워크, 로깅 및 컨트롤러 메트릭으로 구성된 이러한 브로커 수준 CloudEvent를 선택할 수 있습니다.
18.5.1. Kafka 서버 지표
다음 표는 Kafka 서버에 대한 정보를 보고하는 다양한 메트릭을 보여줍니다.
메트릭 | CloudEvent | 설명 | 예상 값 |
---|---|---|---|
초당 메시지 |
| 브로커가 개별 메시지를 사용하는 비율입니다. | 클러스터의 다른 브로커와 대략 동일합니다. |
초당 바이트 수 |
| 브로커가 생산자에서 보낸 데이터를 사용하는 비율입니다. | 클러스터의 다른 브로커와 대략 동일합니다. |
초당 복제 바이트 수 |
| 다른 브로커에서 전송된 데이터는 추적자 브로커에 의해 소비됩니다. | 해당 없음 |
초당 바이트 수 |
| 소비자가 데이터를 가져와서 브로커에서 읽는 비율입니다. | 해당 없음 |
초당 만료 바이트 수입니다. |
| 데이터가 브로커에서 다른 브로커로 전송되는 비율입니다. 이 메트릭은 브로커가 파티션 그룹의 리더인지 모니터링하는 데 유용합니다. | 해당 없음 |
복제 대상 파티션 |
| 후속 복제본에서 완전히 복제되지 않은 파티션 수입니다. | Zero |
최소 ISR 파티션 수 |
| 최소 IISR(In-Sync Replica) 수에 따른 파티션 수입니다. ISR 개수는 리더와 최신 복제본 세트를 나타냅니다. | Zero |
파티션 수 |
| 브로커의 파티션 수입니다. | 약은 다른 브로커와 비교할 때 발생합니다. |
리더 수 |
| 이 브로커가 리더인 복제본 수입니다. | 클러스터의 다른 브로커와 대략 동일합니다. |
ISR은 초당 축소 |
| 브로커의 ISR 수가 감소하는 속도 | Zero |
ISR은 초당 확장 |
| 브로커의 ISR 수가 증가하는 비율입니다. | Zero |
최대 지연 |
| 리더 복제본과 후속 복제본에서 메시지를 수신하는 시간 사이의 최대 지연입니다. | 생성 요청의 최대 배치 크기에 비례합니다. |
프로듀서의 요청 |
| 프로듀서의 전송 요청 수입니다. | 해당 없음 |
요청 in fetch purgatory |
| 가져오기 정리의 가져오기 요청 수입니다. | 해당 없음 |
요청 처리기 평균 유휴 상태 백분율 |
| 요청 처리기 (IO) 스레드가 사용되지 않는 시간의 백분율을 나타냅니다.Indicates the percentage of time that the request handler (IO) threads are not in use. | 값이 낮으면 브로커의 워크로드가 높습니다. |
요청 (Requests exclude from throttling) |
| 제한에서 제외되는 요청 수입니다. | 해당 없음 |
zookeeper 요청 대기 시간(밀리초) |
| 브로커의 ZooKeeper 요청에 대한 대기 시간(밀리초)입니다. | 해당 없음 |
zookeeper 세션 상태 |
| 브로커에 대한 연결 상태를 ZooKeeper로 설정합니다. | 연결 |
18.5.2. Kafka 네트워크 지표
다음 표에서는 요청에 대한 정보를 보고하는 메트릭 선택 방법을 보여줍니다.
메트릭 | CloudEvent | 설명 | 예상 값 |
---|---|---|---|
초당 요청 수 |
|
초당 요청 유형에 대한 총 요청 수입니다. | 해당 없음 |
요청 바이트(바이트 단위 요청 크기) |
|
요청 속성으로 식별되는 요청 유형에 대해 이루어진 요청 크기(바이트)입니다. | 해당 없음 |
임시 메모리 크기(바이트 단위) |
| 메시지 형식 변환 및 메시지 압축 해제에 사용되는 임시 메모리 양입니다. | 해당 없음 |
메시지 변환 시간 |
| 메시지 형식을 변환하는 데 소비되는 시간(밀리초)입니다. | 해당 없음 |
총 요청 시간(밀리초) |
| 요청을 처리하는 데 소비된 총 시간(밀리초)입니다. | 해당 없음 |
요청 대기열 시간(밀리초) |
|
요청에서 현재 요청 속성에 지정된 요청 유형에 대한 큐에서 현재 사용하는 시간(밀리초)입니다. | 해당 없음 |
시간(leader 로컬 처리 시간)(밀리초) |
| 리더가 요청을 처리하는 데 걸리는 시간(밀리초)입니다. | 해당 없음 |
밀리초 단위 원격 시간(leader remote processing time) |
|
요청이 후속 조치를 기다리는 시간(밀리초)입니다. 사용 가능한 모든 요청 유형에 대해 별도의 CloudEvent가 | 해당 없음 |
응답 대기열 시간(밀리초) |
| 요청이 응답 큐에서 대기하는 시간(밀리초)입니다. | 해당 없음 |
응답 전송 시간(밀리초) |
| 응답을 보내는 데 걸리는 시간(밀리초)입니다. | 해당 없음 |
네트워크 프로세서 평균 유휴 상태 백분율 |
| 네트워크 프로세서가 유휴 상태인 시간의 평균 백분율입니다. | 0에서 1 사이입니다. |
18.5.3. Kafka 로그 메트릭
다음 표에서는 로깅에 대한 정보를 보고하는 다양한 메트릭을 보여줍니다.
메트릭 | CloudEvent | 설명 | 예상 값 |
---|---|---|---|
플러시 속도 및 시간(밀리초) |
| 로그 데이터가 디스크에 기록되는 속도(밀리초)입니다. | 해당 없음 |
오프라인 로그 디렉터리 수 |
| 오프라인 로그 디렉터리 수(예: 하드웨어 장애 발생). | Zero |
18.5.4. Kafka 컨트롤러 메트릭
다음 표에서는 클러스터 컨트롤러에 대한 정보를 보고하는 다양한 메트릭을 보여줍니다.
메트릭 | CloudEvent | 설명 | 예상 값 |
---|---|---|---|
활성 컨트롤러 수 |
| 컨트롤러로 지정된 브로커 수입니다. | 하나는 브로커가 클러스터의 컨트롤러임을 나타냅니다. |
리더 선택 속도 및 시간(밀리초) |
| 새 리더 복제본이 선택된 비율입니다. | Zero |
18.5.5. CloudEvent 메트릭
속도 또는 시간을 나타내는 메트릭은 10.0.0.1 메트릭으로 제공됩니다. 10.0.0.1 메트릭을 사용하는 CloudEvent의 클래스 이름 앞에 com.yammer.metrics
가 있습니다.
iPXE 속도 메트릭에는 요청 모니터링에 대해 다음과 같은 속성이 있습니다.
- 수량
- eventType (Bytes)
- FifteenMinuteRate
- RateUnit (Seconds)
- MeanRate
- OneMinuteRate
- FiveMinuteRate
iPXE 시간 메트릭에는 요청 모니터링에 대해 다음과 같은 속성이 있습니다.
- 최대
- min
- mean
- StdDev
- 75/95/98/99/99.9th Percentile