复制过滤通过在从库配置规则控制同步数据,减少存储压力并提升性能。基于数据库或表的参数如replicate-do-table、replicate-wild-ignore-table等实现精细过滤,需在my.cnf中设置并重启复制进程。注意USE语句影响匹配,跨库操作可能引发不一致,建议初期配置并避免复杂拓扑使用。

MySQL复制过滤用于在主从复制过程中控制哪些数据库或表的数据需要同步,适用于只需要部分数据复制的场景。通过合理配置复制过滤规则,可以减少从库的存储压力、提升性能,同时满足业务对数据隔离的需求。
1. 复制过滤的基本原理
MySQL复制基于二进制日志(binlog)进行,主库记录所有更改操作,从库通过I/O线程读取并写入中继日志,再由SQL线程执行这些操作。复制过滤就是在SQL线程执行前,根据配置规则决定是否跳过某些事件。
注意:复制过滤只能在从库上配置,且建议在复制开始前设置,避免数据不一致。
2. 配置复制过滤的常用参数
MySQL提供多个参数用于实现复制过滤,主要分为两类:基于数据库的过滤和基于表的过滤。
(1)基于数据库的过滤
- replicate-do-db=db_name:只复制指定数据库的操作。如果SQL语句使用了USE db_name,则只对该库生效。
- replicate-ignore-db=db_name:忽略指定数据库的所有操作。
(2)基于表的过滤
- replicate-do-table=db_name.table_name:只复制指定表的操作。
- replicate-ignore-table=db_name.table_name:忽略指定表的所有操作。
-
replicate-wild-do-table=db_name.pattern:使用通配符匹配表名进行复制,如
db1.user_%。 -
replicate-wild-ignore-table=db_name.pattern:使用通配符忽略匹配的表,如
test.%可忽略test库下所有表。
3. 配置步骤与示例
以下是一个实际配置示例:
需求:只同步主库的user_db数据库中的user_info和order_info表,忽略test库所有表。
编辑从库的my.cnf配置文件:
[mysqld] # 只同步指定表 replicate-do-table = user_db.user_info replicate-do-table = user_db.order_info忽略test库所有表
replicate-wild-ignore-table = test.%
启用GTID(可选,推荐)
gtid_mode = ON enforce_gtid_consistency = ON
重启MySQL服务或动态加载部分参数后,重启复制进程:
STOP SLAVE; START SLAVE;
可通过SHOW SLAVE STATUS\G检查复制状态,确认没有错误。
4. 使用注意事项
- 使用
replicate-do-db时,主库的SQL语句必须显式指定当前数据库(如USE db),否则可能无法正确匹配。 - 混合使用多种过滤规则时,规则按顺序判断,遇到匹配项即执行对应动作。
- 一旦启用复制过滤,主库的跨库操作(如JOIN不同库的表)可能导致从库出错或数据不一致。
- 不建议在多级复制或复杂拓扑中随意使用复制过滤,容易引发维护困难。
基本上就这些。合理使用复制过滤能有效优化复制结构,但需结合实际业务谨慎配置,避免误过滤关键数据。










