首先检查副本集状态,确认网络与认证配置正常,必要时扩容oplog或强制重新同步。

当MongoDB主从节点数据不同步时,通常出现在副本集架构中。虽然传统“主从复制”已被副本集(Replica Set)取代,但大家仍习惯称主节点为Primary,从节点为Secondary。数据不同步可能由网络中断、节点宕机、oplog大小不足或配置错误引起。以下是排查和解决的常见方法。
检查副本集状态
连接到Secondary节点,运行以下命令查看同步状态:
rs.status()
重点关注以下字段:
- stateStr:应为 "SECONDARY" 或 "PRIMARY"
- optime:与主节点的oplog时间是否接近
- health:值为1表示正常,0表示不可达或异常
- errmsg:如果有错误会在这里显示
如果节点处于 STARTUP、RECOVERING 或 ROLLBACK 状态,说明正在尝试恢复同步。
确认Oplog是否足够大
MongoDB通过oplog(操作日志)实现复制。如果主节点写入量大而oplog太小,Secondary可能因无法追上而落后太多,最终需要全量同步。
查看oplog大小和时间跨度:
use local db.oplog.rs.stats()
关注 size 和 maxSize 字段。建议oplog保留至少24小时的操作记录。若过小,可手动扩容oplog。
JSON(JavaScript Object Notation) 定义:一种轻量级的数据交换格式,具有良好的可读和便于快速编写的特性。业内主流技术为其提供了完整的解决方案(有点类似于正则表达式,获得了当今大部分语言的支持),从而可以在不同平台间进行数据交换。JSON采用兼容性很高的文本格式,同时也具备类似于C语言体系的行为。有需要的朋友可以下载看看
强制重新同步(Resync)
当Secondary数据严重滞后或出现不一致,最彻底的解决方式是清除其数据目录并触发全量同步:
- 停止Secondary mongod 实例
- 删除数据目录下的所有文件(如 /data/db/*)
- 重启mongod服务
启动后,MongoDB会自动检测到无数据,向Primary请求完整数据快照,然后重放oplog完成同步。
注意:确保Primary节点数据完整且oplog未被覆盖,否则会导致同步失败。
检查网络与认证配置
网络不通或认证失败也会导致无法同步:
- 确认Primary和Secondary之间端口(默认27017)可通
- 检查防火墙或安全组设置
- 验证副本集成员间使用相同的 keyFile 或认证机制
- 查看mongod日志(logPath指定的文件),搜索 "replSet error" 或 "connection refused"
基本上就这些。多数不同步问题通过检查状态、清理数据目录并重新同步即可解决。关键是保证oplog不被覆盖、网络通畅、权限正确。MongoDB的复制机制很健壮,只要底层稳定,同步会自动恢复。









