PostgreSQL堆表以8KB页面存储数据,页面由页头、行指针、数据行和空闲空间组成,数据行通过t_xmin、t_xmax、t_ctid等实现MVCC;表文件分为主段、fsm、vm三部分,支持多版本并发控制与高效VACUUM,ctid用于定位行但随更新变化。

PostgreSQL 的堆表(Heap-Organized Table)是默认的表存储结构,数据以“堆”的形式组织,不强制要求物理存储顺序与逻辑顺序一致。理解 heap 文件如何组织,有助于深入掌握 PostgreSQL 的存储机制、查询性能优化和底层数据访问方式。
堆表的基本存储单元:页面(Page)
PostgreSQL 将每个表的数据存储在一组固定大小的文件块中,称为页面(Page),默认大小为 8KB。每个堆表对应一个或多个物理文件,文件按段(segment)划分,每个段包含一系列页面。
堆表中的每个页面遵循统一的结构,主要包括:
- 页头(Page Header):存储页面的元信息,如空闲空间起始位置、项目指针数量等。
- 行指针项(Item Pointer Array):位于页头之后,是一个数组,每一项指向该页中实际数据行的偏移位置。
- 数据行区域(Heap Tuple Space):存放实际的数据行(tuple),从页面末尾向前增长。
- 空闲空间(Free Space):位于行指针和数据行之间,用于插入新记录或更新现有记录。
数据行(Tuple)的内部结构
每条记录在堆表中以 HeapTuple 的形式存在,其结构包括以下几个部分:
- t_xmin:创建该行版本的事务 ID。
- t_xmax:删除或更新该行版本的事务 ID,若为 0 表示未被删除。
- t_cid:命令 ID,表示在当前事务中的操作顺序。
- t_ctid:指向该行的物理地址(块号 + 项索引),用于定位行的最新版本。
- Null 位图、属性长度信息:用于变长字段和 NULL 值的标识。
- 用户数据:实际存储的列值。
当发生 UPDATE 操作时,PostgreSQL 不直接修改原行,而是插入一条新的 tuple,并将原行的 t_xmax 标记为当前事务 ID,实现多版本并发控制(MVCC)。
文件层级与物理存储布局
每个堆表在文件系统中对应一个主数据文件,路径通常为:base/{db_oid}/{relfilenode}。其中 relfilenode 是表的逻辑标识。
- 主段文件(main fork):存储表的主要数据内容,即堆表的页面序列。
- _fsm 文件:空闲空间映射(Free Space Map),记录各页面的可用空间,用于插入时快速定位合适页面。
- _vm 文件:可见性映射(Visibility Map),标识哪些页面中的所有元组对所有事务都可见,可加速 VACUUM 操作。
当表数据超过 1GB 时,会生成多个段文件(如 relfilenode.1, relfilenode.2),每个段最多 1GB,按需扩展。
行的定位与 ctid
在堆表中,每行通过 ctid 唯一定位,格式为 (block_number, item_pointer)。例如 (0,1) 表示第 0 个页面中的第 1 条记录。
ctid 在行被更新后会发生变化,因此不能作为长期引用。但可用于快速定位物理行位置,例如:
SELECT ctid, * FROM my_table WHERE id = 100;
结合 ctid 可进行底层调试或手动清理重复数据。
基本上就这些。理解 PostgreSQL 堆表的组织方式,有助于分析查询执行计划、VACUUM 行为以及避免表膨胀问题。虽然日常开发无需直接操作 heap 文件,但在性能调优和故障排查中,这些知识非常实用。










