0

0

Debezium Java嵌入式连接器:解决MySQL数据变更捕获配置问题

霞舞

霞舞

发布时间:2025-11-29 15:22:20

|

316人浏览过

|

来源于php中文网

原创

Debezium Java嵌入式连接器:解决MySQL数据变更捕获配置问题

本文旨在解决使用debezium java嵌入式连接器捕获mysql数据变更时遇到的常见配置问题。重点阐述了`database.include.list`与`table.include.list`的正确用法,并指出`whitelist`属性的弃用。通过优化连接器配置,确保debezium能够准确监控并捕获数据库中的增删改事件,从而实现可靠的变更数据捕获。

Debezium Java嵌入式连接器概述

Debezium是一个开源的分布式平台,用于捕获各种数据库的变更数据(Change Data Capture, CDC)。它通过读取数据库的事务日志(如MySQL的binlog)来实时地捕获数据行级别的变更,并将这些变更事件流式传输到Apache Kafka或其他消息队列。Debezium提供了一个Java嵌入式连接器(Embedded Engine),允许开发者在自己的Java应用程序中直接运行Debezium连接器,无需依赖完整的Kafka Connect集群。

在使用Debezium Java嵌入式连接器时,常见的挑战是正确配置连接器以确保它能够准确地监控并捕获所需数据库或表的数据变更。即使连接成功,如果配置不当,Debezium也可能无法触发相应的事件处理逻辑。

核心配置问题分析

当Debezium连接到MySQL数据库并显示连接成功日志(例如Connected to localhost:3305 at binlog.000008/3443),但却未能捕获到数据变更事件时,问题通常出在连接器的配置上。以下是常见的配置误区:

  1. database.include.list与table.include.list的混淆:

    立即学习Java免费学习笔记(深入)”;

    • database.include.list属性用于指定Debezium应监控的数据库名称列表,其值应为逗号分隔的数据库名(例如db1,db2)。
    • table.include.list属性则用于指定Debezium应监控的表名称列表,其值应为逗号分隔的完全限定表名(例如db1.table1,db2.table2)。
    • 在原始配置中,database.include.list被错误地设置为String.join(",", mysql.getTables()),这实际上是将表名列表传递给了数据库列表属性,导致Debezium无法正确识别要监控的数据库。
  2. database.whitelist和table.whitelist属性的弃用:

    • 在Debezium的早期版本中,曾使用database.whitelist和table.whitelist来指定包含列表。然而,这些属性在较新的Debezium版本中已被弃用并移除,取而代之的是database.include.list、database.exclude.list、table.include.list和table.exclude.list。
    • 原始配置中同时使用了database.whitelist和table.whitelist,并将其值设置为mysql.*。这不仅使用了已弃用的属性,而且其值也可能与database.include.list的意图冲突,进一步导致配置混乱。

正确的配置实践

为了确保Debezium能够正确捕获MySQL的数据变更,我们需要根据其设计意图来配置database.include.list和table.include.list。

假设我们希望监控名为my_application_db数据库中的user表。

示例代码:优化Debezium连接器配置

以下是DebeziumConfigLoader.load方法的优化版本,展示了如何正确配置Debezium MySQL连接器:

Detect GPT
Detect GPT

一个Chrome插件,检测您浏览的页面是否包含人工智能生成的内容

下载
import io.debezium.config.Configuration;
import java.util.Properties;

public class DebeziumConfigLoader {

    public static Configuration load(Connection connection) {
        final MysqlConnection mysql = connection.getMysqlConnection();

        // 获取要监控的数据库名称
        String databaseToMonitor = mysql.getDbName(); 
        // 获取要监控的表名称列表,例如 "my_application_db.user"
        // 假设 mysql.getTables() 返回的是 "user"
        String tablesToMonitor = databaseToMonitor + "." + String.join("," , mysql.getTables());

        return Configuration.create()
                .with("name", "customer-mysql-connector")
                .with("connector.class", "io.debezium.connector.mysql.MySqlConnector")
                .with("offset.storage", "org.apache.kafka.connect.storage.FileOffsetBackingStore")
                .with("offset.flush.interval.ms", "60000")
                .with("database.hostname", mysql.getHost())
                .with("database.port", mysql.getPort())
                .with("database.user", mysql.getUsername())
                .with("database.password", mysql.getPassword())
                // 正确配置:指定要监控的数据库名称
                .with("database.include.list", databaseToMonitor) 
                // 正确配置:指定要监控的完全限定表名称
                .with("table.include.list", tablesToMonitor) 
                .with("include.schema.changes", "false")
                .with("database.server.id", "10181") // 确保此ID在所有Debezium连接器实例中唯一
                .with("database.server.name", "customer-mysql-db-server")
                .with("database.history", "io.debezium.relational.history.FileDatabaseHistory")
                .with("database.history.file.filename", "/tmp/dbhistory.dat")
                .with("offset.storage.file.filename", "/tmp/offsets.dat")
                // 移除已弃用的 'database.whitelist' 和 'table.whitelist'
                // .with("database.whitelist", "mysql.*") // 此行应被移除
                // .with("table.whitelist", "mysql.*")    // 此行应被移除
                .build();
    }
}

关键修改点:

  • database.include.list: 现在只包含实际的数据库名称(例如my_application_db)。
  • table.include.list: 现在包含完全限定的表名(例如my_application_db.user)。如果mysql.getTables()返回的是不带数据库名的表名,需要手动拼接。
  • 移除database.whitelist和table.whitelist: 避免使用已弃用的属性,并消除潜在的配置冲突。

注意事项与最佳实践

  1. Debezium版本兼容性: 始终查阅您所使用的Debezium版本的官方文档,以了解最新的配置属性和任何弃用信息。属性名称和行为可能在不同版本之间发生变化。

  2. MySQL用户权限: 确保Debezium连接的MySQL用户拥有足够的权限来读取binlog和访问被监控的数据库和表。通常需要REPLICATION SLAVE和SELECT权限。

  3. MySQL Binlog配置:

    • MySQL的log_bin必须开启。
    • binlog_format应设置为ROW,这是Debezium捕获详细变更所必需的。
    • server_id在MySQL服务器配置中必须是唯一的,并且Debezium连接器配置中的database.server.id也必须是唯一的,且与MySQL服务器的server_id不同。
  4. database.server.id的唯一性: database.server.id用于Debezium标识自身在MySQL复制协议中的从属ID。如果运行多个Debezium连接器实例(即使是不同的应用程序),每个实例都必须配置一个唯一的database.server.id,以避免与MySQL复制协议中的其他从库或Debezium实例冲突。

  5. 偏移量存储 (offset.storage) 和数据库历史 (database.history):

    • offset.storage用于持久化Debezium已处理的binlog位置。当应用程序重启时,Debezium可以从上次中断的地方继续捕获事件,避免数据丢失或重复。在嵌入式模式下,FileOffsetBackingStore是一个简单的选择,但生产环境可能考虑使用更健壮的存储,如数据库。
    • database.history用于存储数据库模式(schema)变更的历史。这对于Debezium正确解析变更事件至关重要。FileDatabaseHistory同样适用于简单场景,但生产环境可能需要考虑Kafka或其他持久化存储
    • 确保offset.storage.file.filename和database.history.file.filename指向的路径是可写且持久化的,以防止应用程序重启后丢失状态。

总结

Debezium Java嵌入式连接器为应用程序集成CDC功能提供了强大而灵活的方式。然而,其有效性高度依赖于准确的配置。通过理解database.include.list和table.include.list的正确用法,避免使用已弃用的属性,并关注MySQL的binlog配置和Debezium的持久化机制,开发者可以确保Debezium能够可靠地捕获数据库变更事件,从而构建出响应式和数据驱动的应用程序。在遇到事件未捕获问题时,仔细检查这些配置项是解决问题的关键。

相关专题

更多
java
java

Java是一个通用术语,用于表示Java软件及其组件,包括“Java运行时环境 (JRE)”、“Java虚拟机 (JVM)”以及“插件”。php中文网还为大家带了Java相关下载资源、相关课程以及相关文章等内容,供大家免费下载使用。

832

2023.06.15

java正则表达式语法
java正则表达式语法

java正则表达式语法是一种模式匹配工具,它非常有用,可以在处理文本和字符串时快速地查找、替换、验证和提取特定的模式和数据。本专题提供java正则表达式语法的相关文章、下载和专题,供大家免费下载体验。

738

2023.07.05

java自学难吗
java自学难吗

Java自学并不难。Java语言相对于其他一些编程语言而言,有着较为简洁和易读的语法,本专题为大家提供java自学难吗相关的文章,大家可以免费体验。

734

2023.07.31

java配置jdk环境变量
java配置jdk环境变量

Java是一种广泛使用的高级编程语言,用于开发各种类型的应用程序。为了能够在计算机上正确运行和编译Java代码,需要正确配置Java Development Kit(JDK)环境变量。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

397

2023.08.01

java保留两位小数
java保留两位小数

Java是一种广泛应用于编程领域的高级编程语言。在Java中,保留两位小数是指在进行数值计算或输出时,限制小数部分只有两位有效数字,并将多余的位数进行四舍五入或截取。php中文网给大家带来了相关的教程以及文章,欢迎大家前来阅读学习。

398

2023.08.02

java基本数据类型
java基本数据类型

java基本数据类型有:1、byte;2、short;3、int;4、long;5、float;6、double;7、char;8、boolean。本专题为大家提供java基本数据类型的相关的文章、下载、课程内容,供大家免费下载体验。

446

2023.08.02

java有什么用
java有什么用

java可以开发应用程序、移动应用、Web应用、企业级应用、嵌入式系统等方面。本专题为大家提供java有什么用的相关的文章、下载、课程内容,供大家免费下载体验。

430

2023.08.02

java在线网站
java在线网站

Java在线网站是指提供Java编程学习、实践和交流平台的网络服务。近年来,随着Java语言在软件开发领域的广泛应用,越来越多的人对Java编程感兴趣,并希望能够通过在线网站来学习和提高自己的Java编程技能。php中文网给大家带来了相关的视频、教程以及文章,欢迎大家前来学习阅读和下载。

16925

2023.08.03

Java 桌面应用开发(JavaFX 实战)
Java 桌面应用开发(JavaFX 实战)

本专题系统讲解 Java 在桌面应用开发领域的实战应用,重点围绕 JavaFX 框架,涵盖界面布局、控件使用、事件处理、FXML、样式美化(CSS)、多线程与UI响应优化,以及桌面应用的打包与发布。通过完整示例项目,帮助学习者掌握 使用 Java 构建现代化、跨平台桌面应用程序的核心能力。

36

2026.01.14

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MySQL 教程
MySQL 教程

共48课时 | 1.8万人学习

MySQL 初学入门(mosh老师)
MySQL 初学入门(mosh老师)

共3课时 | 0.3万人学习

简单聊聊mysql8与网络通信
简单聊聊mysql8与网络通信

共1课时 | 793人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号