PostgreSQL页面结构由页头、行指针数组和数据区组成,支持MVCC与高效存储管理。页头占24字节,含LSN、标志位、空闲空间指针等;行指针从底部向上增长,指向实际数据行;数据区存放HeapTuple,包含系统字段和用户数据;更新操作生成新版本行,旧版本标记删除;页面末尾特殊区域用于索引结构;通过pageinspect可查看页面内容,有助于分析空间使用与优化vacuum策略。

PostgreSQL 的页面结构是数据库存储管理的核心组成部分,每个数据页默认大小为 8KB(可编译时调整),用于组织表和索引中的数据。理解页面结构有助于深入掌握 PostgreSQL 的存储机制和性能优化。
页面基本布局
一个 PostgreSQL 数据页由三部分组成:页头(Page Header)、行指针项(Item Pointer Array)和行数据区(Heap Tuple Storage Area)。
页头信息位于页面最开始,固定占用 24 字节,包含以下关键字段:
- pd_lsn:记录最近一次修改该页的 WAL 日志序列号
- pd_checksum:页面校验和(若启用)
- pd_flags:页面状态标志,如是否空页、是否有行指针、是否有空闲空间等
- pd_lower:指向行指针数组末尾的位置,初始等于页头长度
- pd_upper:指向数据区中可用空间的起始位置
- pd_special:特殊区域起始位置,用于索引等特定结构
- pd_pagesize_version:页面大小和版本号
- pd_prune_xid:可用于裁剪的最老事务 ID
行指针与数据存储
在页头之后是行指针数组(也叫 ItemIdData 数组),每个条目占 4 字节,指向实际的数据行(Tuple)。行指针从页面底部向上增长,而数据内容从页头后方向下填充,中间的空白区域为可用空闲空间。
每个行指针包含:
- 偏移量(offset):数据行在页面内的起始位置
- 长度(length):该行数据的大小
- 标志位(flags):表示该行的状态,如是否已删除(LP_DEAD)、是否被重定向等
实际的数据行(HeapTuple)按顺序存放在数据区,其结构包括:
- HeapTupleHeader:包含 xmin、xmax、t_ctid、t_infomask 等系统字段
- 用户数据:表中各列的实际值
当某行被更新时,PostgreSQL 使用“插入新版本 + 标记旧版本”方式实现 MVCC,多个版本可能共存于同一页面或不同页面。
特殊区域与扩展用途
页面末尾的特殊区域(Special Space)主要用于索引类型,例如 B-tree 页面在此区域存储内部节点结构(如左右子页指针、分裂信息等)。普通堆表页面的特殊区域通常为空。
页面中的空闲空间由 pd_lower 和 pd_upper 共同界定。当插入新行时,系统检查是否有足够空间;若不足,则触发页面分裂或使用 FSM(空闲空间映射)查找其他合适页面。
实际查看页面内容的方法
可通过 pageinspect 扩展查看页面底层结构:
CREATE EXTENSION pageinspect;SELECT * FROM heap_page_items(get_raw_page('tablename', 0));
这条命令能列出指定表第一页中所有行指针及其状态,帮助分析行版本、空闲空间使用情况等。
基本上就这些。PostgreSQL 页面结构设计兼顾效率与 MVCC 支持,合理利用空间并支持高并发访问。理解它对调优 vacuum 策略、减少膨胀、提升 I/O 效率都有帮助。










