2.3. Kafka Connect 클러스터 구성
KafkaConnect 리소스를 사용하여 Kafka Connect 배포를 구성합니다. Kafka Connect는 커넥터 플러그인을 사용하여 Kafka 브로커와 기타 시스템 간에 데이터를 스트리밍하기 위한 통합 툴킷입니다. Kafka Connect는 커넥터를 사용하여 데이터를 가져오거나 내보내기 위해 데이터베이스 등의 외부 데이터 소스 또는 대상과 Kafka를 통합하기 위한 프레임워크를 제공합니다. 커넥터는 필요한 연결 구성을 제공하는 플러그인입니다.
4.2.65절. “KafkaConnect 스키마 참조” KafkaConnect 리소스의 전체 스키마를 설명합니다.
커넥터 플러그인 배포에 대한 자세한 내용은 커넥터 플러그인 을 사용하여 Kafka Connect 확장을 참조하십시오.
2.3.1. Kafka Connect 구성 링크 복사링크가 클립보드에 복사되었습니다!
Kafka Connect를 사용하여 Kafka 클러스터에 대한 외부 데이터 연결을 설정합니다. KafkaConnect 리소스의 속성을 사용하여 Kafka Connect 배포를 구성합니다.
KafkaConnector 구성
KafkaConnector 리소스를 사용하면 OpenShift 네이티브 방식으로 Kafka Connect에 대한 커넥터 인스턴스를 생성하고 관리할 수 있습니다.
Kafka Connect 구성에서 strimzi.io/use-connector-resources 주석을 추가하여 Kafka Connect 클러스터에 KafkaConnectors를 활성화합니다. AMQ Streams가 데이터 연결에 필요한 커넥터 플러그인으로 컨테이너 이미지를 자동으로 빌드하도록 빌드 구성을 추가할 수도 있습니다. Kafka Connect 커넥터의 외부 구성은 externalConfiguration 속성을 통해 지정됩니다.
커넥터를 관리하려면 KafkaConnector 사용자 지정 리소스 또는 Kafka Connect REST API를 사용할 수 있습니다. KafkaConnector 리소스를 연결하는 Kafka Connect 클러스터와 동일한 네임스페이스에 배포해야 합니다. 이러한 방법을 사용하여 커넥터를 생성, 재구성 또는 삭제하는 방법에 대한 자세한 내용은 커넥터 추가 를 참조하십시오.
커넥터 구성은 HTTP 요청의 일부로 Kafka Connect에 전달되고 Kafka 자체 내에 저장됩니다. ConfigMaps 및 Secrets는 구성 및 기밀 데이터를 저장하는 데 사용되는 표준 OpenShift 리소스입니다. ConfigMaps 및 Secrets를 사용하여 커넥터의 특정 요소를 구성할 수 있습니다. 그런 다음 필요한 경우 구성을 별도로 보다 안전하게 유지하는 HTTP REST 명령에서 구성 값을 참조할 수 있습니다. 이 방법은 사용자 이름, 암호 또는 인증서와 같은 기밀 데이터에 특히 적용됩니다.
대량의 메시지 처리
대량의 메시지를 처리하도록 구성을 조정할 수 있습니다. 자세한 내용은 대량 의 메시지 처리를 참조하십시오.
사전 요구 사항
- OpenShift 클러스터
- 실행 중인 Cluster Operator
다음을 실행하는 방법에 대한 자세한 내용은 OpenShift에 AMQ Streams 배포 및 업그레이드 가이드를 참조하십시오.
절차
KafkaConnect리소스의spec속성을 편집합니다.구성할 수 있는 속성은 다음 예제 구성에 표시되어 있습니다.
apiVersion: kafka.strimzi.io/v1beta2 kind: KafkaConnect1 metadata: name: my-connect-cluster annotations: strimzi.io/use-connector-resources: "true"2 spec: replicas: 33 authentication:4 type: tls certificateAndKey: certificate: source.crt key: source.key secretName: my-user-source bootstrapServers: my-cluster-kafka-bootstrap:90925 tls:6 trustedCertificates: - secretName: my-cluster-cluster-cert certificate: ca.crt - secretName: my-cluster-cluster-cert certificate: ca2.crt config:7 group.id: my-connect-cluster offset.storage.topic: my-connect-cluster-offsets config.storage.topic: my-connect-cluster-configs status.storage.topic: my-connect-cluster-status key.converter: org.apache.kafka.connect.json.JsonConverter value.converter: org.apache.kafka.connect.json.JsonConverter key.converter.schemas.enable: true value.converter.schemas.enable: true config.storage.replication.factor: 3 offset.storage.replication.factor: 3 status.storage.replication.factor: 3 build:8 output:9 type: docker image: my-registry.io/my-org/my-connect-cluster:latest pushSecret: my-registry-credentials plugins:10 - name: debezium-postgres-connector artifacts: - type: tgz url: https://repo1.maven.org/maven2/io/debezium/debezium-connector-postgres/2.1.3.Final/debezium-connector-postgres-2.1.3.Final-plugin.tar.gz sha512sum: c4ddc97846de561755dc0b021a62aba656098829c70eb3ade3b817ce06d852ca12ae50c0281cc791a5a131cb7fc21fb15f4b8ee76c6cae5dd07f9c11cb7c6e79 - name: camel-telegram artifacts: - type: tgz url: https://repo.maven.apache.org/maven2/org/apache/camel/kafkaconnector/camel-telegram-kafka-connector/0.11.5/camel-telegram-kafka-connector-0.11.5-package.tar.gz sha512sum: d6d9f45e0d1dbfcc9f6d1c7ca2046168c764389c78bc4b867dab32d24f710bb74ccf2a007d7d7a8af2dfca09d9a52ccbc2831fc715c195a3634cca055185bd91 externalConfiguration:11 env: - name: AWS_ACCESS_KEY_ID valueFrom: secretKeyRef: name: aws-creds key: awsAccessKey - name: AWS_SECRET_ACCESS_KEY valueFrom: secretKeyRef: name: aws-creds key: awsSecretAccessKey resources:12 requests: cpu: "1" memory: 2Gi limits: cpu: "2" memory: 2Gi logging:13 type: inline loggers: log4j.rootLogger: INFO readinessProbe:14 initialDelaySeconds: 15 timeoutSeconds: 5 livenessProbe: initialDelaySeconds: 15 timeoutSeconds: 5 metricsConfig:15 type: jmxPrometheusExporter valueFrom: configMapKeyRef: name: my-config-map key: my-key jvmOptions:16 "-Xmx": "1g" "-Xms": "1g" image: my-org/my-image:latest17 rack: topologyKey: topology.kubernetes.io/zone18 template:19 pod: affinity: podAntiAffinity: requiredDuringSchedulingIgnoredDuringExecution: - labelSelector: matchExpressions: - key: application operator: In values: - postgresql - mongodb topologyKey: "kubernetes.io/hostname" connectContainer:20 env: - name: OTEL_SERVICE_NAME value: my-otel-service - name: OTEL_EXPORTER_OTLP_ENDPOINT value: "http://otlp-host:4317" tracing: type: opentelemetry21 - 1
KafkaConnect를 사용합니다.- 2
- Kafka Connect 클러스터의 KafkaConnectors를 활성화합니다.
- 3
- 작업을 실행하는 작업자 의 복제본 노드 수입니다.
- 4
- Kafka Connect 클러스터에 대한 인증: mTLS,토큰 기반 OAuth, SASL 기반 SCRAM 기반 SCRAM-256/SCRAM-SHA -512, 또는 PLAIN 으로 지정됩니다. 기본적으로 Kafka Connect는 일반 텍스트 연결을 사용하여 Kafka 브로커에 연결합니다.
- 5
- Kafka Connect 클러스터에 연결하기 위한 부트스트랩 서버 입니다.
- 6
- TLS 인증서가 클러스터의 X.509 형식으로 저장되는 키 이름을 사용한 TLS 암호화 입니다. 인증서가 동일한 보안에 저장된 경우 여러 번 나열할 수 있습니다.
- 7
- Kafka Connect 작업자 구성 (연결이 아님). 표준 Apache Kafka 구성을 제공하여 AMQ Streams에서 직접 관리하지 않는 속성으로 제한될 수 있습니다.
- 8
- 커넥터 플러그인이 자동으로 컨테이너 이미지를 빌드하기 위한 구성 속성을 빌드 합니다.
- 9
- (필수) 새 이미지가 푸시되는 컨테이너 레지스트리의 설정(필수)입니다.
- 10
- (필수) 새 컨테이너 이미지에 추가할 커넥터 플러그인 및 아티팩트 목록. 각 플러그인은 하나 이상의
아티팩트로 구성해야 합니다. - 11
- 여기에 표시된 환경 변수 또는 볼륨을 사용하는 커넥터의 외부 구성입니다. 구성 공급자 플러그인을 사용하여 외부 소스에서 구성 값을 로드할 수도 있습니다.
- 12
- 13
- 지정된 Kafka Connect 로거 및 로그 수준은 ConfigMap을 통해 직접 (
인라인) 또는 간접적으로(외부)합니다. 사용자 지정 ConfigMap은log4j.properties또는log4j2.properties키에 배치해야 합니다. Kafka Connectlog4j.rootLogger로거의 경우 로그 수준을 INFO, ERROR, WARN, TRACE, DEBUG, FATAL 또는 OFF로 설정할 수 있습니다. - 14
- 컨테이너(liveness)를 다시 시작할 시기와 컨테이너가 트래픽을 수락할 수 있는 시기(가용성)를 확인할 수 있는 상태 점검 입니다.
- 15
- Prometheus 지표: 이 예제에서 Prometheus exporter에 대한 구성이 포함된 ConfigMap을 참조하여 활성화합니다.
metricsConfig.valueFrom.configMapKeyRef.key아래에 빈 파일이 포함된 ConfigMap에 대한 참조를 사용하여 추가 구성 없이 메트릭을 활성화할 수 있습니다. - 16
- Kafka Connect 를 실행하는 VM(가상 머신)의 성능을 최적화하는 JVM 구성 옵션입니다.
- 17
- ADVANCED OPTION : 컨테이너 이미지 구성.이는 특별한 경우에만 권장됩니다.
- 18
- SPECIALIZED OPTION: 배포에 대한 인식 인식 구성입니다. 이는 리전이 아닌 동일한 위치 내의 배포를 위한 특수 옵션입니다. 리더 복제본이 아닌 가장 가까운 복제본에서 커넥터를 소비하려면 이 옵션을 사용합니다. 경우에 따라 가장 가까운 복제본에서 소비하면 네트워크 사용률을 향상시키거나 비용을 줄일 수 있습니다.
topologyKey는 rack ID가 포함된 노드 레이블과 일치해야 합니다. 이 구성에 사용된 예제에서는 표준topology.kubernetes.io/zone레이블을 사용하여 영역을 지정합니다. 가장 가까운 복제본에서 사용하려면 Kafka 브로커 구성에서RackAwareReplicaSelector를 활성화합니다. - 19
- 템플릿 사용자 지정. 여기에서 Pod는 유사성 방지로 예약되므로 Pod는 동일한 호스트 이름이 있는 노드에 예약되지 않습니다.
- 20
- 환경 변수는 분산 추적을 위해 설정됩니다.
- 21
- OpenTelemetry를 사용하여 분산 추적을 활성화합니다.
리소스를 생성하거나 업데이트합니다.
oc apply -f KAFKA-CONNECT-CONFIG-FILE- Kafka Connect에 대한 인증이 활성화된 경우 Kafka Connect 소비자 그룹 및 항목에 대한 액세스를 활성화하도록 Kafka Connect 사용자를 구성합니다.
2.3.2. 여러 인스턴스에 대한 Kafka Connect 구성 링크 복사링크가 클립보드에 복사되었습니다!
Kafka Connect의 여러 인스턴스를 실행하는 경우 다음 구성 속성의 기본 구성을 변경해야 합니다.
apiVersion: kafka.strimzi.io/v1beta2
kind: KafkaConnect
metadata:
name: my-connect
spec:
# ...
config:
group.id: connect-cluster
offset.storage.topic: connect-cluster-offsets
config.storage.topic: connect-cluster-configs
status.storage.topic: connect-cluster-status
# ...
# ...
세 항목의 값은 동일한 group.id 가 있는 모든 Kafka Connect 인스턴스에 대해 동일해야 합니다.
기본 설정을 변경하지 않으면 동일한 Kafka 클러스터에 연결하는 각 Kafka Connect 인스턴스가 동일한 값으로 배포됩니다. 실제로 모든 인스턴스가 클러스터에서 실행되고 동일한 주제를 사용하도록 연결된 것입니다.
여러 Kafka Connect 클러스터가 동일한 주제를 사용하려고 하면 Kafka Connect가 예상대로 작동하지 않고 오류를 생성합니다.
여러 Kafka Connect 인스턴스를 실행하려면 각 인스턴스에 대해 이러한 속성의 값을 변경합니다.
2.3.3. Kafka Connect 사용자 권한 부여 구성 링크 복사링크가 클립보드에 복사되었습니다!
다음 절차에서는 Kafka Connect에 대한 사용자 액세스 권한을 부여하는 방법을 설명합니다.
Kafka에서 권한 부여 유형을 사용하는 경우 Kafka Connect 사용자는 소비자 그룹 및 Kafka Connect의 내부 항목에 대한 읽기/쓰기 액세스 권한이 필요합니다.
소비자 그룹 및 내부 주제의 속성은 AMQ Streams에 의해 자동으로 구성되거나 KafkaConnect 리소스의 사양에 명시적으로 지정할 수 있습니다.
KafkaConnect 리소스의 설정 속성 예
apiVersion: kafka.strimzi.io/v1beta2
kind: KafkaConnect
metadata:
name: my-connect
spec:
# ...
config:
group.id: my-connect-cluster
offset.storage.topic: my-connect-cluster-offsets
config.storage.topic: my-connect-cluster-configs
status.storage.topic: my-connect-cluster-status
# ...
# ...
다음 절차에서는 간단한 권한 부여를 사용할 때 액세스를 제공하는 방법을 설명합니다.
간단한 권한 부여에서는 Kafka AclAuthorizer 플러그인에서 처리하는 ACL 규칙을 사용하여 적절한 액세스 수준을 제공합니다. 간단한 권한을 사용하도록 KafkaUser 리소스를 구성하는 방법에 대한 자세한 내용은 AclRule 스키마 참조 를 참조하십시오.
소비자 그룹 및 주제의 기본값은 여러 인스턴스를 실행할 때 다릅니다.
사전 요구 사항
- OpenShift 클러스터
- 실행 중인 Cluster Operator
절차
KafkaUser리소스에서authorization속성을 편집하여 사용자에게 액세스 권한을 제공합니다.다음 예제에서는
리터럴이름 값을 사용하여 Kafka Connect 주제 및 소비자 그룹에 대한 액세스 권한이 구성됩니다.Expand 속성 이름 offset.storage.topicconnect-cluster-offsetsstatus.storage.topicconnect-cluster-statusconfig.storage.topicconnect-cluster-configsgroupconnect-clusterapiVersion: kafka.strimzi.io/v1beta2 kind: KafkaUser metadata: name: my-user labels: strimzi.io/cluster: my-cluster spec: # ... authorization: type: simple acls: # access to offset.storage.topic - resource: type: topic name: connect-cluster-offsets patternType: literal operations: - Create - Describe - Read - Write host: "*" # access to status.storage.topic - resource: type: topic name: connect-cluster-status patternType: literal operations: - Create - Describe - Read - Write host: "*" # access to config.storage.topic - resource: type: topic name: connect-cluster-configs patternType: literal operations: - Create - Describe - Read - Write host: "*" # consumer group - resource: type: group name: connect-cluster patternType: literal operations: - Read host: "*"리소스를 생성하거나 업데이트합니다.
oc apply -f KAFKA-USER-CONFIG-FILE
2.3.4. Kafka Connect 클러스터 리소스 목록 링크 복사링크가 클립보드에 복사되었습니다!
다음 리소스는 OpenShift 클러스터의 Cluster Operator에 의해 생성됩니다.
- connect-cluster-name-connect
다음 Kafka Connect 리소스에 지정된 이름입니다.
-
Kafka Connect 작업자 노드 Pod를 생성하는 배포(
StableConnectIdentities기능 게이트가 비활성화된 경우). -
Kafka Connect 작업자 노드 Pod를 생성하는 StrimziPodSet(
StableConnectIdentities기능 게이트가 활성화된 경우). -
Connect Pod에 안정적인 DNS 이름을 제공하는 헤드리스 서비스(
StableConnectIdentities기능 게이트가 활성화된 경우) - Kafka Connect 작업자 노드에 대해 구성된 Pod 중단 예산입니다.
-
Kafka Connect 작업자 노드 Pod를 생성하는 배포(
- connect-cluster-name-connect-idx
-
Kafka Connect StrimziPodSet에서 생성한 Pod(
StableConnectIdentities기능 게이트가 활성화된 경우) - connect-cluster-name-connect-api
- Kafka Connect 클러스터를 관리하기 위한 REST 인터페이스를 노출하는 서비스입니다.
- connect-cluster-name-config
- Kafka Connect 보조 구성이 포함되어 있고 Kafka 브로커 Pod에서 볼륨으로 마운트되는 ConfigMap입니다.
2.3.5. 변경 데이터 캡처를 위해 Red Hat build of Debezium과 통합 링크 복사링크가 클립보드에 복사되었습니다!
Red Hat build of Debezium은 분산 변경 데이터 캡처 플랫폼입니다. 데이터베이스의 행 수준 변경 사항을 캡처하고, 변경 이벤트 레코드를 생성하며, 해당 레코드를 Kafka 주제로 스트리밍합니다. Debezium은 Apache Kafka를 기반으로 합니다. Debezium의 Red Hat 빌드를 배포하고 AMQ Streams와 통합할 수 있습니다. AMQ Streams를 배포한 후 Kafka Connect를 통해 Debezium을 커넥터 구성으로 배포합니다. Debezium은 변경 이벤트 레코드를 OpenShift의 AMQ Streams에 전달합니다. 애플리케이션은 이러한 변경 이벤트 스트림을 읽고 발생한 순서대로 변경 이벤트에 액세스할 수 있습니다.
Debezium에는 다음과 같은 여러 용도가 있습니다.
- 데이터 복제
- 캐시 및 검색 인덱스 업데이트
- 모놀리식 애플리케이션 간소화
- 데이터 통합
- 스트리밍 쿼리 활성화
데이터베이스 변경 사항을 캡처하려면 Debezium 데이터베이스 커넥터를 사용하여 Kafka Connect를 배포합니다. 커넥터 인스턴스를 정의하도록 KafkaConnector 리소스를 구성합니다.
AMQ Streams를 사용하여 Debezium의 Red Hat 빌드 배포에 대한 자세한 내용은 제품 설명서 를 참조하십시오. 이 문서에는 데이터베이스 업데이트에 대한 변경 이벤트 레코드를 보는 데 필요한 서비스 및 커넥터 설정 프로세스를 안내하는 Debezium 시작하기 가이드가 포함되어 있습니다.