第 4 章 查看更改事件


部署 Debezium MySQL 连接器后,它开始捕获对 inventory 数据库的更改。

当连接器启动时,它会将事件写入一组 Apache Kafka 主题,每个主题代表 MySQL 数据库中的一个表。每个主题的名称从数据库服务器的名称 dbserver1 开头。

连接器写入以下 Kafka 主题:

dbserver1
模式更改适用于捕获更改的表的 DDL 语句的主题。
dbserver1.inventory.products
接收 inventory 数据库中 产品表 的更改事件记录。
dbserver1.inventory.products_on_hand
接收 inventory 数据库中 products_on_hand 表的更改事件记录。
dbserver1.inventory.customers
接收 inventory 数据库中 customers 表的更改事件记录。
dbserver1.inventory.orders
接收 inventory 数据库中顺序 的更改事件记录。

本教程的其余部分将检查 dbserver1.inventory.customers Kafka 主题。随着您对主题更接近,您会看到它如何代表不同类型的更改事件,并查找有关连接器捕获每个事件的信息。

教程包含以下部分:

4.1. 查看 创建事件

通过查看 dbserver1.inventory.customers 主题,您可以看到 MySQL 连接器如何在 inventory 数据库中捕获 create 事件。在这种情况下,创建事件 捕获了添加到数据库中的新客户。

流程

  1. 打开一个终端,并使用 kafka-console-consumer 使用主题开头的 dbserver1.inventory.customers 主题。

    此命令在运行 Kafka 的 Pod 中运行一个简单的消费者(kafka-console-consumer.sh) (my-cluster-kafka-0):

    $ oc exec -it my-cluster-kafka-0 -- /opt/kafka/bin/kafka-console-consumer.sh \
      --bootstrap-server localhost:9092 \
      --from-beginning \
      --property print.key=true \
      --topic dbserver1.inventory.customers

    消费者返回四个消息(采用 JSON 格式),每个行在 customers 表中一行。每个消息都包含对应表行的事件记录。

    每个事件有两个 JSON 文档:一个 key 和一个 value。键对应于行的主键,值显示行的详细信息(行包含的字段、每个字段的值以及行上执行的操作类型)。

  2. 有关最后一个事件,请查看 密钥 的详细信息。

    以下是最后一次事件 的关键 详情(用于可读性的格式):

    {
      "schema":{
        "type":"struct",
          "fields":[
            {
              "type":"int32",
              "optional":false,
              "field":"id"
            }
          ],
        "optional":false,
        "name":"dbserver1.inventory.customers.Key"
      },
      "payload":{
        "id":1004
      }
    }

    事件有两个部分: schema 和一个 有效负载schema 包含一个 Kafka Connect 模式,用于描述有效负载中的内容。在这种情况下,有效负载是名为 dbserver1.inventory.customers.Keystruct,它是可选的,且有一个必填字段(类型为 int32id )。

    payload 是一个单一的 id 字段,它的值为 1004

    通过查看事件的 key,您可以看到此事件应用到 inventory.customers 表中的 id 主键栏的值为 1004 的行。

  3. 查看同一事件 的详细信息。

    事件 的值 显示创建了行,并描述了其包含的内容(本例中为 idfirst_namelast_name 以及插入行 的电子邮件 )。

    以下是最后一次事件 的详细信息(用于可读性的格式):

    {
      "schema": {
        "type": "struct",
        "fields": [
          {
            "type": "struct",
            "fields": [
              {
                "type": "int32",
                "optional": false,
                "field": "id"
              },
              {
                "type": "string",
                "optional": false,
                "field": "first_name"
              },
              {
                "type": "string",
                "optional": false,
                "field": "last_name"
              },
              {
                "type": "string",
                "optional": false,
                "field": "email"
              }
            ],
            "optional": true,
            "name": "dbserver1.inventory.customers.Value",
            "field": "before"
          },
          {
            "type": "struct",
            "fields": [
              {
                "type": "int32",
                "optional": false,
                "field": "id"
              },
              {
                "type": "string",
                "optional": false,
                "field": "first_name"
              },
              {
                "type": "string",
                "optional": false,
                "field": "last_name"
              },
              {
                "type": "string",
                "optional": false,
                "field": "email"
              }
            ],
            "optional": true,
            "name": "dbserver1.inventory.customers.Value",
            "field": "after"
          },
          {
            "type": "struct",
            "fields": [
              {
                "type": "string",
                "optional": true,
                "field": "version"
              },
              {
                "type": "string",
                "optional": false,
                "field": "name"
              },
              {
                "type": "int64",
                "optional": false,
                "field": "server_id"
              },
              {
                "type": "int64",
                "optional": false,
                "field": "ts_sec"
              },
              {
                "type": "string",
                "optional": true,
                "field": "gtid"
              },
              {
                "type": "string",
                "optional": false,
                "field": "file"
              },
              {
                "type": "int64",
                "optional": false,
                "field": "pos"
              },
              {
                "type": "int32",
                "optional": false,
                "field": "row"
              },
              {
                "type": "boolean",
                "optional": true,
                "field": "snapshot"
              },
              {
                "type": "int64",
                "optional": true,
                "field": "thread"
              },
              {
                "type": "string",
                "optional": true,
                "field": "db"
              },
              {
                "type": "string",
                "optional": true,
                "field": "table"
              }
            ],
            "optional": false,
            "name": "io.debezium.connector.mysql.Source",
            "field": "source"
          },
          {
            "type": "string",
            "optional": false,
            "field": "op"
          },
          {
            "type": "int64",
            "optional": true,
            "field": "ts_ms"
          }
        ],
        "optional": false,
        "name": "dbserver1.inventory.customers.Envelope",
        "version": 1
      },
      "payload": {
        "before": null,
        "after": {
          "id": 1004,
          "first_name": "Anne",
          "last_name": "Kretchmar",
          "email": "annek@noanswer.org"
        },
        "source": {
          "version": "2.1.4.Final",
          "name": "dbserver1",
          "server_id": 0,
          "ts_sec": 0,
          "gtid": null,
          "file": "mysql-bin.000003",
          "pos": 154,
          "row": 0,
          "snapshot": true,
          "thread": null,
          "db": "inventory",
          "table": "customers"
        },
        "op": "r",
        "ts_ms": 1486500577691
      }
    }

    该事件的这一部分比较长,但就像事件 的密钥 一样,它也具有 schema有效负载schema 包括了一个 Kafka Connect 方案,称为 dbserver1.inventory.customers.Envelope (version 1),它可以包括五个字段:

    op
    包含描述操作类型的字符串值的必填字段。MySQL 连接器的值是 c 用于创建(或插入)、u 用于 update、d 用于 delete,r 用于读取(在快照的情况下)。
    之前
    可选字段(如果存在)包含事件 发生前 行的状态。该结构将由 dbserver1.inventory.customers.Value Kafka Connect 模式描述,dbserver1 连接器用于 inventory.customers 表中的所有行。
    after
    如果存在,可选字段包含 事件后 行的状态。该结构与之前使用的 dbserver1.inventory.customers.Value Kafka Connect schema 相同。
    source
    包含描述事件源元数据的必填字段(在 MySQL 时为 MySQL)包含几个字段:连接器名称、记录事件的 binlog 文件的名称,该 binlog 文件中的位置,事件出现的位置,事件中的行(如果有多个字段), 受影响的数据库和表的名称,以及受影响的数据库和表的名称, 进行更改的 MySQL 线程 ID,无论是快照的一部分,如果可用,MySQL 服务器 ID 以及时间戳(以秒为单位)。
    ts_ms
    如果存在,可选字段包含运行 Kafka Connect 任务的 JVM 中的系统时钟,其中连接器处理该事件。
    注意

    事件的 JSON 表示比它们描述的行要长。这是因为,对于每个事件键和值,Kafka Connect 会提供描述 有效负载的 schema。随着时间的推移,此结构可能会改变。但是,如果拥有键的模式和事件本身的值,可以更轻松地消耗应用程序来理解消息,特别是在一段时间内变化。

    Debezium MySQL 连接器根据数据库表的结构构建这些模式。如果您使用 DDL 语句更改 MySQL 数据库中的表定义,连接器会读取这些 DDL 语句并更新其 Kafka Connect 模式。这是每个事件结构的唯一方式,它类似于发生事件时来自该表的表。但是,包含单个表的所有事件的 Kafka 主题可能具有与表定义的每个状态对应的事件。

    JSON 转换器在每条消息中包含键和值模式,因此它会生成非常详细的事件。

  4. 将事件的 keyvalue 方案与 inventory 数据库的状态进行比较。在运行 MySQL 命令行客户端的终端中,运行以下命令:

    mysql> SELECT * FROM customers;
    +------+------------+-----------+-----------------------+
    | id   | first_name | last_name | email                 |
    +------+------------+-----------+-----------------------+
    | 1001 | Sally      | Thomas    | sally.thomas@acme.com |
    | 1002 | George     | Bailey    | gbailey@foobar.com    |
    | 1003 | Edward     | Walker    | ed@walker.com         |
    | 1004 | Anne       | Kretchmar | annek@noanswer.org    |
    +------+------------+-----------+-----------------------+
    4 rows in set (0.00 sec)

    这表明您检查的事件记录与数据库中的记录匹配。

Red Hat logoGithubRedditYoutubeTwitter

学习

尝试、购买和销售

社区

关于红帽文档

通过我们的产品和服务,以及可以信赖的内容,帮助红帽用户创新并实现他们的目标。

让开源更具包容性

红帽致力于替换我们的代码、文档和 Web 属性中存在问题的语言。欲了解更多详情,请参阅红帽博客.

關於紅帽

我们提供强化的解决方案,使企业能够更轻松地跨平台和环境(从核心数据中心到网络边缘)工作。

© 2024 Red Hat, Inc.