20장. AMQ Streams에 대한 메트릭 및 대시보드 설정


Kafka 배포의 상태 및 성능을 이해하기 위해서는 메트릭 수집이 중요합니다. 메트릭을 모니터링하면 문제가 중요해지기 전에 적극적으로 문제를 식별하고 리소스 할당 및 용량 계획에 대한 정보에 입각한 결정을 내릴 수 있습니다. 메트릭이 없으면 Kafka 배포의 동작에 대한 가시성이 제한되므로 문제 해결에 더 어렵고 시간이 오래 걸릴 수 있습니다. 메트릭을 설정하면 장기적으로 시간과 리소스를 절약하고 Kafka 배포의 안정성을 보장할 수 있습니다.

지표는 AMQ Streams의 각 구성 요소에 사용할 수 있으므로 개별 성능에 대한 중요한 통찰력을 제공합니다. 다른 구성 요소에는 메트릭 노출을 노출하기 위한 구성이 필요하지만 AMQ Streams Operator는 기본적으로 Prometheus 지표를 자동으로 노출합니다. 이러한 메트릭에는 다음이 포함됩니다.

  • 조정 수
  • 처리 중인 사용자 정의 리소스 수
  • 조정 기간
  • JVM 지표

Kafka 리소스의 리스너 또는 권한 부여 구성에서 enableMetrics 속성을 활성화하여 oauth 인증 및 opa 또는 keycloak 권한과 관련된 메트릭을 수집할 수도 있습니다. 마찬가지로 KafkaBridge,KafkaConnect, KafkaMirrorMaker 및 KafkaMirrorMaker 2 와 같은 사용자 정의 리소스에서 oauth 인증에 대한 지표를 활성화할 수 있습니다.

Prometheus 및 Grafana를 사용하여 AMQ Streams를 모니터링할 수 있습니다. Prometheus 규칙으로 구성된 경우 Prometheus는 클러스터에서 실행 중인 Pod에서 메트릭을 사용합니다. Grafana는 이러한 지표를 대시보드에 시각화하여 모니터링을 위한 직관적인 인터페이스를 제공합니다.

메트릭 통합을 용이하게 하기 위해 AMQ Streams는 AMQ Streams 구성 요소에 대한 Prometheus 규칙 및 Grafana 대시보드 예제를 제공합니다. 특정 배포 요구 사항에 맞게 예제 Grafana 대시보드를 사용자 지정할 수 있습니다. 규칙을 사용하여 특정 메트릭에 따라 경고를 트리거하는 조건을 정의할 수 있습니다.

모니터링 요구 사항에 따라 다음을 수행할 수 있습니다.

또한 분산 추적을 설정하거나 진단 도구 (report.sh)를 사용하여 문제 해결 데이터를 검색하여 메시지를 엔드 투 엔드로 추적 하도록 배포를 구성할 수 있습니다.

참고

AMQ Streams는 Prometheus 및 Grafana의 설치 파일의 예를 제공합니다. 이 파일은 AMQ Streams 배포를 모니터링하기 위한 시작점으로 사용할 수 있습니다. 추가 지원을 받으려면 Prometheus 및 Grafana 개발자 커뮤니티에 참여해 보십시오.

메트릭 및 모니터링 툴에 대한 지원 문서

메트릭 및 모니터링 툴에 대한 자세한 내용은 지원 문서를 참조하십시오.

20.1. Kafka 내보내기로 소비자 지연 모니터링

Kafka 내보내기 는 Apache Kafka 브로커 및 클라이언트의 모니터링을 개선하는 오픈 소스 프로젝트입니다. Kafka 클러스터와 함께 Kafka 내보내기를 배포하도록 Kafka 리소스를 구성할 수 있습니다. Kafka Exporter는 오프셋, 소비자 그룹, 소비자 지연 및 주제와 관련된 Kafka 브로커에서 추가 지표 데이터를 추출합니다. 예를 들어 지표 데이터가 느린 소비자를 식별하는 데 사용됩니다. 지연 데이터는 Prometheus 지표로 노출되며 분석을 위해 Grafana에 표시될 수 있습니다.

Kafka Exporter는 소비자 그룹에 대해 커밋된 오프셋에 대한 정보를 저장하는 __consumer_offsets 주제에서 읽습니다. Kafka 내보내기가 제대로 작동하려면 소비자 그룹을 사용 중이어야 합니다.

Kafka Exporter의 Grafana 대시보드는 AMQ Streams에서 제공하는 여러 가지 Grafana 대시보드 중 하나입니다.

중요

Kafka Exporter는 소비자 지연 및 소비자 오프셋과 관련된 추가 메트릭만 제공합니다. 일반 Kafka 메트릭의 경우 Kafka 브로커 에서 Prometheus 지표를 구성해야 합니다.

소비자 지연은 프로덕션 속도 및 메시지 소비 속도의 차이를 나타냅니다. 특히 지정된 소비자 그룹의 소비자 지연은 파티션의 마지막 메시지와 해당 소비자가 현재 선택 중인 메시지 간의 지연을 나타냅니다.

지연은 파티션 로그의 끝과 관련하여 소비자 오프셋의 위치를 반영합니다.

생산자와 소비자 오프셋 간의 소비자 지연

Consumer lag

이러한 차이점은 생산자 오프셋과 소비자 오프셋 간의 CloudEvent라고 합니다. Kafka 브로커 주제 파티션의 읽기 및 쓰기 위치입니다.

주제가 100개의 메시지 1초를 스트리밍한다고 가정합니다. 생산자 오프셋(주제 파티션 헤드)과 소비자가 읽은 마지막 오프셋 사이에 1000개의 메시지 지연은 10초 지연을 의미합니다.

소비자 지연 모니터링의 중요성

(near) 실시간 데이터 처리에 의존하는 애플리케이션의 경우 소비자 지연을 모니터링하여 너무 크지 않은지 확인하는 것이 중요합니다. 지연이 클수록 프로세스가 실시간 처리 목표에서 더 많이 이동합니다.

예를 들어 소비자 지연은 제거되지 않은 오래된 데이터를 너무 많이 소비하거나 계획되지 않은 종료를 통해 소비한 결과일 수 있습니다.

소비자 지연 감소

Grafana 차트를 사용하여 지연을 분석하고 작업을 줄이는 작업이 영향을 받는 소비자 그룹에 영향을 미치는지 확인합니다. 예를 들어 Kafka 브로커가 지연을 줄이기 위해 조정되면 대시보드에 소비자 그룹 차트가 내려가고 분별 차트가 소비되는 메시지가 표시됩니다.

지연을 줄이기 위한 일반적인 작업은 다음과 같습니다.

  • 새 소비자를 추가하여 확장 소비자 그룹
  • 메시지에 대한 보존 시간이 항목에 남아 있게 늘립니다.Increase the retention time for a message to remain in a topic.
  • 메시지 버퍼를 늘리기 위한 디스크 용량 추가

소비자 지연을 줄이기 위한 조치는 기본 인프라에 따라 다르며 AMQ Streams가 지원하는 사용 사례에 따라 다릅니다. 예를 들어 지연된 소비자는 브로커가 디스크 캐시에서 가져오기 요청을 처리할 수 있다는 이점이 적습니다. 그리고 특정 경우에는 소비자가 캡처될 때까지 메시지를 자동으로 삭제하는 것이 허용될 수 있습니다.

Red Hat logoGithubredditYoutubeTwitter

자세한 정보

평가판, 구매 및 판매

커뮤니티

Red Hat 문서 정보

Red Hat을 사용하는 고객은 신뢰할 수 있는 콘텐츠가 포함된 제품과 서비스를 통해 혁신하고 목표를 달성할 수 있습니다. 최신 업데이트를 확인하세요.

보다 포괄적 수용을 위한 오픈 소스 용어 교체

Red Hat은 코드, 문서, 웹 속성에서 문제가 있는 언어를 교체하기 위해 최선을 다하고 있습니다. 자세한 내용은 다음을 참조하세요.Red Hat 블로그.

Red Hat 소개

Red Hat은 기업이 핵심 데이터 센터에서 네트워크 에지에 이르기까지 플랫폼과 환경 전반에서 더 쉽게 작업할 수 있도록 강화된 솔루션을 제공합니다.

Theme

© 2026 Red Hat
맨 위로 이동