2.3. Kafka Connect 클러스터 구성
이 섹션에서는 AMQ Streams 클러스터에서 Kafka Connect 배포를 구성하는 방법을 설명합니다.
Kafka Connect는 커넥터 플러그인을 사용하여 Kafka 브로커와 기타 시스템 간에 데이터를 스트리밍하기 위한 통합 툴킷입니다. Kafka Connect는 커넥터를 사용하여 데이터를 가져오거나 내보내기 위해 데이터베이스와 같은 외부 데이터 소스 또는 대상을 통합하기 위한 프레임워크를 제공합니다. Connectors는 필요한 연결 구성을 제공하는 플러그인입니다. KafkaConnect 리소스의 전체 스키마는 12.2.59절. “KafkaConnect 스키마 참조” 에 설명되어 있습니다.
커넥터 플러그인 배포에 대한 자세한 내용은 커넥터 플러그인을 사용하여 Kafka Connect 확장 기능을 참조하십시오.
2.3.1. Kafka Connect 구성 링크 복사링크가 클립보드에 복사되었습니다!
Kafka Connect를 사용하여 Kafka 클러스터에 대한 외부 데이터 연결을 설정합니다. KafkaConnect 리소스의 속성을 사용하여 Kafka Connect 배포를 구성합니다.
KafkaConnector 구성
KafkaConnector 리소스를 사용하면 OpenShift 네이티브 방식으로 Kafka Connect의 커넥터 인스턴스를 생성하고 관리할 수 있습니다.
Kafka Connect 구성에서 strimzi.io/use-connector-resources 주석을 추가하여 Kafka Connect 클러스터에 대한 KafkaConnectors를 활성화합니다. AMQ Streams가 데이터 연결에 필요한 커넥터 플러그인으로 컨테이너 이미지를 자동으로 빌드하도록 빌드 구성을 추가할 수도 있습니다. Kafka Connect 커넥터에 대한 외부 구성은 externalConfiguration 속성을 통해 지정됩니다.
커넥터를 관리하려면 Kafka Connect REST API를 사용하거나 KafkaConnector 사용자 정의 리소스를 사용할 수 있습니다. KafkaConnector 리소스는 연결된 Kafka Connect 클러스터와 동일한 네임스페이스에 배포해야 합니다. 이러한 방법을 사용하여 커넥터를 생성, 재구성 또는 삭제하는 방법에 대한 자세한 내용은 커넥터 생성 및 관리를 참조하십시오.
커넥터 구성은 HTTP 요청의 일부로 Kafka Connect에 전달되어 Kafka 자체에 저장됩니다. ConfigMaps 및 Secrets는 구성 및 기밀 데이터를 저장하는 데 사용되는 표준 OpenShift 리소스입니다. ConfigMaps 및 Secrets를 사용하여 커넥터의 특정 요소를 구성할 수 있습니다. 그런 다음 필요한 경우 구성을 분리하고 더 안전하게 유지하는 HTTP REST 명령에서 구성 값을 참조할 수 있습니다. 이 방법은 특히 사용자 이름, 암호 또는 인증서와 같은 기밀 데이터에 적용됩니다.
대량의 메시지 처리
많은 양의 메시지를 처리하도록 구성을 조정할 수 있습니다. 자세한 내용은 2.7절. “대량의 메시지 처리”의 내용을 참조하십시오.
사전 요구 사항
- OpenShift 클러스터
- 실행중인 Cluster Operator
다음을 실행하는 방법에 대한 자세한 내용은 OpenShift에서 AMQ Streams 배포 및 업그레이드 가이드를 참조하십시오.
절차
KafkaConnect리소스의사양속성을 편집합니다.구성할 수 있는 속성은 이 예제 구성에 표시됩니다.
Copy to Clipboard Copied! Toggle word wrap Toggle overflow - 1
KafkaConnect를 사용합니다.- 2
- Kafka Connect 클러스터의 KafkaConnectors를 활성화합니다.
- 3
- 작업을 실행하는 작업자 의 복제본 노드 수입니다.
- 4
- 여기에 표시된 대로, OAuth 전달 토큰 을 사용하거나 SASL 기반 SCRAM-SHA-256/SCRAM-SHA-512 또는 PLAIN 메커니즘을 사용하여 Kafka Connect 클러스터에 대한 인증입니다. ??? 기본적으로 Kafka Connect는 일반 텍스트 연결을 사용하여 Kafka 브로커에 연결합니다.
- 5
- Kafka Connect 클러스터 연결을 위한 부트스트랩 서버 입니다.
- 6
- TLS 인증서가 클러스터의 X.509 형식으로 저장되는 키 이름으로 TLS 암호화 인증서가 동일한 시크릿에 저장된 경우 여러 번 나열할 수 있습니다.
- 7
- 작업자의 Kafka Connect 구성 (연결이 아님). 표준 Apache Kafka 구성은 AMQ Streams에서 직접 관리하지 않는 속성으로 제한될 수 있습니다.
- 8
- 커넥터 플러그인을 사용하여 컨테이너 이미지를 빌드하기 위한 구성 속성을 자동으로 빌드 합니다.
- 9
- (필수) 새 이미지를 내보내는 컨테이너 레지스트리의 구성입니다.
- 10
- (필수) 새 컨테이너 이미지에 추가할 커넥터 플러그인 및 해당 아티팩트 목록입니다. 각 플러그인은 하나 이상의
아티팩트로 구성해야 합니다. - 11
- 12
- 13
- 지정된 Kafka Connect 로거 및 로그 수준이 직접(
인라인) 또는 ConfigMap을 통해 간접적으로(외부)됩니다. 사용자 정의 ConfigMap은log4j.properties또는log4j2.properties키 아래에 배치해야 합니다. Kafka Connectlog4j.rootLogger로거의 경우 로그 수준을 INFO, ERROR, WARN, TRACE, DEBUG, FATAL 또는 OFF로 설정할 수 있습니다. - 14
- 컨테이너를 다시 시작할 시기(라이브)와 컨테이너가 트래픽을 허용할 시기(준비)를 확인할 상태 점검 입니다.
- 15
- Prometheus 지표: 이 예제에서 Prometheus Cryostat 내보내기에 대한 구성이 포함된 ConfigMap을 참조하여 활성화됩니다.
metricsConfig.valueFrom.configMapKeyRef.key아래에 빈 파일이 포함된 ConfigMap에 대한 참조를 사용하여 추가 구성 없이 메트릭을 활성화할 수 있습니다. - 16
- Kafka Connect 를 실행하는 VM(가상 머신)의 성능을 최적화하는 JVM 구성 옵션입니다.
- 17
- ADVANCED OPTION : 특수한 상황에서만 권장되는 컨테이너 이미지 구성입니다.
- 18
- SPECIALIZED OPTION: 배포에 대한 Rack 인식 구성입니다. 이는 지역이 아닌 동일한 위치 내의 배포를 위한 특수 옵션입니다. 리더 복제본 대신 커넥터가 가장 가까운 복제본에서 사용할 수 있도록 하려면 이 옵션을 사용합니다. 경우에 따라 가장 가까운 복제본에서 소비하면 네트워크 사용률을 개선하거나 비용을 절감할 수 있습니다.
topologyKey는 랙 ID가 포함된 노드 레이블과 일치해야 합니다. 이 구성에 사용된 예제에서는 표준topology.kubernetes.io/zone레이블을 사용하는 영역을 지정합니다. 가장 가까운 복제본에서 사용하려면 Kafka 브로커 구성에서RackAwareReplicaSelector를 활성화합니다. - 19
- 템플릿 사용자 지정. 여기에서 Pod는 유사성 방지를 사용하여 예약되므로 이름이 동일한 노드에 Pod가 예약되지 않습니다.
- 20
- 환경 변수는 Jaeger를 사용하여 분산 추적에도 설정됩니다.
리소스를 생성하거나 업데이트합니다.
oc apply -f KAFKA-CONNECT-CONFIG-FILE
oc apply -f KAFKA-CONNECT-CONFIG-FILECopy to Clipboard Copied! Toggle word wrap Toggle overflow - Kafka Connect에 대한 권한 부여가 활성화된 경우 Kafka Connect 사용자를 구성하여 Kafka Connect 소비자 그룹 및 항목에 대한 액세스를 활성화합니다.
2.3.2. 여러 인스턴스에 대한 Kafka Connect 구성 링크 복사링크가 클립보드에 복사되었습니다!
Kafka Connect의 여러 인스턴스를 실행하는 경우 다음 구성 속성의 기본 구성을 변경해야 합니다.
세 주제의 값은 동일한 group.id 가 있는 모든 Kafka Connect 인스턴스에 대해 동일해야 합니다.
기본 설정을 변경하지 않으면 동일한 Kafka 클러스터에 연결하는 각 Kafka Connect 인스턴스가 동일한 값으로 배포됩니다. 실제로 모든 인스턴스가 클러스터에서 실행되고 동일한 주제를 사용하기 위해 결합됩니다.
여러 Kafka Connect 클러스터가 동일한 주제를 사용하려고 하면 Kafka Connect가 예상대로 작동하지 않고 오류를 생성합니다.
여러 Kafka Connect 인스턴스를 실행하려면 각 인스턴스의 이러한 속성 값을 변경합니다.
2.3.3. Kafka Connect 사용자 권한 부여 구성 링크 복사링크가 클립보드에 복사되었습니다!
다음 절차에서는 Kafka Connect에 대한 사용자 액세스 권한을 부여하는 방법을 설명합니다.
Kafka에서 모든 유형의 권한 부여를 사용하는 경우 Kafka Connect 사용자에게 소비자 그룹에 대한 읽기/쓰기 액세스 권한과 Kafka Connect의 내부 주제가 필요합니다.
소비자 그룹 및 내부 주제의 속성은 AMQ Streams에 의해 자동으로 구성되거나 KafkaConnect 리소스의 사양에 명시적으로 지정할 수 있습니다.
KafkaConnect 리소스의 구성 속성 예
다음 절차에서는 간단한 권한 부여를 사용할 때 액세스 제공 방법을 보여줍니다.
간단한 인증에서는 Kafka AclAuthorizer 플러그인에서 처리하는 ACL 규칙을 사용하여 올바른 액세스 수준을 제공합니다. 간단한 인증을 사용하도록 KafkaUser 리소스를 구성하는 방법에 대한 자세한 내용은 AclRule 스키마 참조를 참조하십시오.
소비자 그룹 및 주제의 기본값은 여러 인스턴스를 실행할 때 다릅니다.
사전 요구 사항
- OpenShift 클러스터
- 실행중인 Cluster Operator
절차
KafkaUser리소스에서권한 부여속성을 편집하여 사용자에게 액세스 권한을 제공합니다.다음 예에서 액세스 권한은
리터럴이름 값을 사용하여 Kafka Connect 주제 및 소비자 그룹에 대해 구성됩니다.Expand 속성 이름 offset.storage.topicconnect-cluster-offsetsstatus.storage.topicconnect-cluster-statusconfig.storage.topicconnect-cluster-configsgroupconnect-clusterCopy to Clipboard Copied! Toggle word wrap Toggle overflow 리소스를 생성하거나 업데이트합니다.
oc apply -f KAFKA-USER-CONFIG-FILE
oc apply -f KAFKA-USER-CONFIG-FILECopy to Clipboard Copied! Toggle word wrap Toggle overflow
2.3.4. Kafka Connect 클러스터 리소스 목록 링크 복사링크가 클립보드에 복사되었습니다!
다음 리소스는 OpenShift 클러스터의 Cluster Operator에 의해 생성됩니다.
- connect-cluster-name-connect
- Kafka Connect 작업자 노드 Pod를 생성합니다.
- connect-cluster-name-connect-api
- Kafka Connect 클러스터 관리를 위한 REST 인터페이스를 노출하는 서비스입니다.
- connect-cluster-name-config
- Kafka Connect ancillary 구성이 포함되어 Kafka 브로커 Pod를 통해 볼륨으로 마운트되는 ConfigMap입니다.
- connect-cluster-name-connect
- Kafka Connect 작업자 노드에 대해 구성된 Pod 중단 예산입니다.
2.3.5. 변경 데이터 캡처를 위한 Debezium 통합 링크 복사링크가 클립보드에 복사되었습니다!
Red Hat Debezium은 분산 변경 데이터 캡처 플랫폼입니다. 데이터베이스의 행 수준 변경 사항을 캡처하고 변경 이벤트 레코드를 생성하며 Kafka 주제로 레코드를 스트리밍합니다. Debezium은 Apache Kafka를 기반으로 합니다. Debezium을 AMQ Streams와 배포 및 통합할 수 있습니다. AMQ Streams를 배포한 후 Kafka Connect를 통해 Debezium을 커넥터 구성으로 배포합니다. Debezium은 OpenShift의 AMQ Streams에 변경 이벤트 레코드를 전달합니다. 애플리케이션은 이러한 변경 이벤트 스트림을 읽고 해당 스트림이 발생한 순서대로 변경 이벤트에 액세스할 수 있습니다.
Debezium은 다음을 포함하여 여러 가지 용도가 있습니다.
- 데이터 복제
- 캐시 및 검색 인덱스 업데이트
- 모놀리식 애플리케이션 간소화
- 데이터 통합
- 스트리밍 쿼리 활성화
데이터베이스 변경 사항을 캡처하려면 Debezium 데이터베이스 커넥터를 사용하여 Kafka Connect를 배포합니다. 커넥터 인스턴스를 정의하도록 KafkaConnector 리소스를 구성합니다.
AMQ Streams를 사용하여 Debezium을 배포하는 방법에 대한 자세한 내용은 제품 설명서 를 참조하십시오. Debezium 설명서에는 데이터베이스 업데이트의 변경 이벤트 레코드를 보는 데 필요한 서비스 및 커넥터 설정 프로세스를 안내하는 Debezium 가이드가 포함되어 있습니다.