Patroni通过分布式协调机制实现PostgreSQL高可用,核心组件包括PostgreSQL实例、分布式配置存储(如etcd)、Patroni进程及Leader Election机制;各节点通过心跳维持状态,主节点故障时触发自动选举与角色切换,确保服务连续性;支持手动failover与switchover,避免脑裂;配置集中存储于etcd并同步至所有节点,支持动态调整与本地覆盖;提供REST API用于查询状态、执行操作,并可集成Prometheus实现监控,整体构建了自动化、自愈型的数据库集群管理体系。

Patroni 是一个用于管理和协调高可用 PostgreSQL 集群的开源工具,它基于分布式配置存储(如 etcd、Consul 或 ZooKeeper)实现自动故障转移、主从切换和集群状态同步。其核心目标是确保数据库服务在节点故障时仍能持续可用,同时简化集群运维操作。
Patroni 的核心架构与组件
Patroni 通过多个组件协同工作来维护 PostgreSQL 集群的状态一致性:
- PostgreSQL 实例:每个数据库节点运行一个 PostgreSQL 服务,由 Patroni 进程统一控制启停和角色切换。
- Distributed Configuration Store:如 etcd,存储集群全局状态信息,包括当前主节点、复制拓扑、配置版本等。所有 Patroni 节点实时监听该存储中的变更。
- Patroni 进程:部署在每个数据库节点上,负责监控本地 PostgreSQL 状态,并根据配置存储中的指令执行角色变更或启动/停止数据库。
- Leader Election 机制:通过分布式锁实现主节点选举。只有一个节点能获得领导者租约,成为主库;其余为从库。
集群状态管理与高可用机制
Patroni 持续维护集群的健康状态,并在异常发生时自动响应:
- 各 Patroni 节点定期向 etcd 发送心跳,维持自身活跃状态。若某节点长时间无心跳,则被标记为失效。
- 当主节点宕机或网络中断时,其他从节点检测到 leader 失效后触发重新选举,选出新的主节点并提升为 primary。
- 新主提升后,更新 etcd 中的 leader 信息,通知所有从库指向新的复制源,确保数据流正确恢复。
- 支持手动故障转移(failover)和计划内切换(switchover),可通过 CLI 或 REST API 执行,避免脑裂问题。
配置同步与动态调整
Patroni 使用集中式配置管理,使集群行为保持一致:
- 全局配置(如 replication mode、recovery settings)存储在 etcd 中,所有节点从中心拉取最新配置。
- 修改配置后,Patroni 可自动重载配置文件,部分参数需重启生效时会提示操作者介入。
- 每个节点也可有本地配置覆盖项,但关键集群参数以中心配置为准,防止配置漂移。
REST API 与外部集成能力
Patroni 提供内置的 HTTP 接口,便于监控和自动化控制:
- 可通过 GET 请求查询节点角色、PostgreSQL 状态、集群拓扑等信息。
- 支持 POST 请求发起故障转移、重启实例或重载配置,适合集成进运维平台或告警系统。
- 结合 Prometheus exporter 可实现指标采集,用于可视化监控延迟、连接数、选举状态等。










