0

0

postgresqlheap文件如何组织_postgresql堆表结构解析

冰川箭仙

冰川箭仙

发布时间:2025-11-22 20:02:02

|

735人浏览过

|

来源于php中文网

原创

PostgreSQL堆表以8KB页面存储数据,页面由页头、行指针、数据行和空闲空间组成,数据行通过t_xmin、t_xmax、t_ctid等实现MVCC;表文件分为主段、fsm、vm三部分,支持多版本并发控制与高效VACUUM,ctid用于定位行但随更新变化。

postgresqlheap文件如何组织_postgresql堆表结构解析

PostgreSQL 的堆表(Heap-Organized Table)是默认的表存储结构,数据以“堆”的形式组织,不强制要求物理存储顺序与逻辑顺序一致。理解 heap 文件如何组织,有助于深入掌握 PostgreSQL 的存储机制、查询性能优化和底层数据访问方式。

堆表的基本存储单元:页面(Page)

PostgreSQL 将每个表的数据存储在一组固定大小的文件块中,称为页面(Page),默认大小为 8KB。每个堆表对应一个或多个物理文件,文件按段(segment)划分,每个段包含一系列页面。

堆表中的每个页面遵循统一的结构,主要包括:

  • 页头(Page Header):存储页面的元信息,如空闲空间起始位置、项目指针数量等。
  • 行指针项(Item Pointer Array):位于页头之后,是一个数组,每一项指向该页中实际数据行的偏移位置。
  • 数据行区域(Heap Tuple Space):存放实际的数据行(tuple),从页面末尾向前增长。
  • 空闲空间(Free Space):位于行指针和数据行之间,用于插入新记录或更新现有记录。

数据行(Tuple)的内部结构

每条记录在堆表中以 HeapTuple 的形式存在,其结构包括以下几个部分:

  • t_xmin:创建该行版本的事务 ID。
  • t_xmax:删除或更新该行版本的事务 ID,若为 0 表示未被删除。
  • t_cid:命令 ID,表示在当前事务中的操作顺序。
  • t_ctid:指向该行的物理地址(块号 + 项索引),用于定位行的最新版本。
  • Null 位图、属性长度信息:用于变长字段和 NULL 值的标识。
  • 用户数据:实际存储的列值。

当发生 UPDATE 操作时,PostgreSQL 不直接修改原行,而是插入一条新的 tuple,并将原行的 t_xmax 标记为当前事务 ID,实现多版本并发控制(MVCC)。

文件层级与物理存储布局

每个堆表在文件系统中对应一个主数据文件,路径通常为:base/{db_oid}/{relfilenode}。其中 relfilenode 是表的逻辑标识。

Open Voice OS
Open Voice OS

OpenVoiceOS是一个社区驱动的开源语音AI平台

下载
  • 主段文件(main fork):存储表的主要数据内容,即堆表的页面序列。
  • _fsm 文件:空闲空间映射(Free Space Map),记录各页面的可用空间,用于插入时快速定位合适页面。
  • _vm 文件:可见性映射(Visibility Map),标识哪些页面中的所有元组对所有事务都可见,可加速 VACUUM 操作。

当表数据超过 1GB 时,会生成多个段文件(如 relfilenode.1, relfilenode.2),每个段最多 1GB,按需扩展。

行的定位与 ctid

在堆表中,每行通过 ctid 唯一定位,格式为 (block_number, item_pointer)。例如 (0,1) 表示第 0 个页面中的第 1 条记录。

ctid 在行被更新后会发生变化,因此不能作为长期引用。但可用于快速定位物理行位置,例如:

SELECT ctid, * FROM my_table WHERE id = 100;

结合 ctid 可进行底层调试或手动清理重复数据。

基本上就这些。理解 PostgreSQL 堆表的组织方式,有助于分析查询执行计划、VACUUM 行为以及避免表膨胀问题。虽然日常开发无需直接操作 heap 文件,但在性能调优和故障排查中,这些知识非常实用。

相关专题

更多
c语言中null和NULL的区别
c语言中null和NULL的区别

c语言中null和NULL的区别是:null是C语言中的一个宏定义,通常用来表示一个空指针,可以用于初始化指针变量,或者在条件语句中判断指针是否为空;NULL是C语言中的一个预定义常量,通常用来表示一个空值,用于表示一个空的指针、空的指针数组或者空的结构体指针。

231

2023.09.22

java中null的用法
java中null的用法

在Java中,null表示一个引用类型的变量不指向任何对象。可以将null赋值给任何引用类型的变量,包括类、接口、数组、字符串等。想了解更多null的相关内容,可以阅读本专题下面的文章。

435

2024.03.01

堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

388

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

571

2023.08.10

golang map内存释放
golang map内存释放

本专题整合了golang map内存相关教程,阅读专题下面的文章了解更多相关内容。

75

2025.09.05

golang map相关教程
golang map相关教程

本专题整合了golang map相关教程,阅读专题下面的文章了解更多详细内容。

28

2025.11.16

golang map原理
golang map原理

本专题整合了golang map相关内容,阅读专题下面的文章了解更多详细内容。

59

2025.11.17

java判断map相关教程
java判断map相关教程

本专题整合了java判断map相关教程,阅读专题下面的文章了解更多详细内容。

36

2025.11.27

Golang gRPC 服务开发与Protobuf实战
Golang gRPC 服务开发与Protobuf实战

本专题系统讲解 Golang 在 gRPC 服务开发中的完整实践,涵盖 Protobuf 定义与代码生成、gRPC 服务端与客户端实现、流式 RPC(Unary/Server/Client/Bidirectional)、错误处理、拦截器、中间件以及与 HTTP/REST 的对接方案。通过实际案例,帮助学习者掌握 使用 Go 构建高性能、强类型、可扩展的 RPC 服务体系,适用于微服务与内部系统通信场景。

6

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
HTML5/CSS3/JavaScript/ES6入门课程
HTML5/CSS3/JavaScript/ES6入门课程

共102课时 | 6.7万人学习

前端基础到实战(HTML5+CSS3+ES6+NPM)
前端基础到实战(HTML5+CSS3+ES6+NPM)

共162课时 | 18.8万人学习

第二十二期_前端开发
第二十二期_前端开发

共119课时 | 12.4万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号