0

0

Linux缓存机制如何理解_pagecache工作原理说明【教程】

舞夢輝影

舞夢輝影

发布时间:2026-01-08 18:54:30

|

781人浏览过

|

来源于php中文网

原创

Page Cache 是 Linux 文件读写的默认路径,非可选优化;它占用内存可被回收,导致 free -h 中可用内存减少,但系统不卡顿,本质是内核积极缓存文件数据。

linux缓存机制如何理解_pagecache工作原理说明【教程】

Page Cache 不是“可选优化”,而是 Linux 文件读写的默认路径——几乎所有 read()write()(非 O_DIRECT)都会经过它。理解它,不是为了调优炫技,而是避免误判内存使用、排查 I/O 延迟、读懂 free -h 里“可用内存”为何越来越小。

为什么 free 显示的可用内存越来越少?

这不是内存泄漏,是内核在积极缓存文件数据:Page Cache 占用的内存只要没被进程锁定(如 mlock()),就随时可被回收。当新内存申请到来,kswapd 会优先回收干净页(clean page),脏页(PG_dirty)则需先回写再释放。

  • 现象:free -havailable 值低,但系统不卡顿 → 很可能只是 Page Cache 占得多
  • 验证:看 /proc/meminfoCached:Dirty: 行,或用 cat /sys/fs/cgroup/memory/memory.stat | grep -E "(cache|dirty)"(cgroup v1)
  • 误区:手动执行 echo 3 > /proc/sys/vm/drop_caches 清缓存 → 短期释放内存,但立刻被新读写填满;且会引发后续大量磁盘读,反而拖慢响应

read()write() 怎么走 Page Cache?

所有带缓冲的文件 I/O 都默认走 Page Cache,核心逻辑由 VFS 层统一调度,不依赖具体文件系统。

  • read() 路径:
    → 查 address_spacexarray(旧内核为 radix tree)找 struct page(按 inode + offset/page_index 定位)
    → 命中且 PG_uptodate==1 → 直接 copy_to_user()
    → 未命中 → 分配页 → 发起磁盘 BIO → 完成后置 PG_uptodate=1 → 加入 LRU
  • write() 路径:
    → 找/分配对应页 → copy_from_user() 写入 → 标记 PG_dirty=1 → 返回(不等刷盘)
    → 脏页由后台 writeback 线程异步刷出,触发条件包括:vm.dirty_ratio(如 20%)、vm.dirty_expire_centisecs(如 3000 = 30 秒)
  • 注意:pwrite()memcpymmap(MAP_SHARED) 区域,同样生成脏页,行为一致

哪些操作会绕过 Page Cache?

绕过 ≠ 更快,而是换一种一致性模型。绕过意味着放弃缓存收益,直面磁盘延迟。

TemPolor
TemPolor

AI音乐生成器,一键创作免版税音乐

下载
  • O_DIRECT:open 时指定 → read()/write() 绕过 Page Cache,直接与块层交互;要求用户 buffer 地址对齐(memalign(4096, size))、长度对齐(4KB 倍数);常见于数据库 WAL 日志写入
  • O_SYNCfsync():不绕过缓存,但强制等待脏页刷盘完成 → 增加延迟,保障持久性
  • Direct I/O + O_SYNC 组合:既绕缓存又等落盘 → 最强持久性,最低吞吐,慎用
  • 错误认知:“dd iflag=direct 就一定不进 Page Cache” → 实际上 dd 的输入文件若未开 O_DIRECT,仍会走 cache;输出设备才决定是否 bypass

如何观察和简单干预 Page Cache 行为?

别迷信“清缓存”,重点看它是否健康工作:命中率高不高?脏页堆积严不严重?

  • 查命中率:cat /proc/vmstat | grep -E "pgpgin|pgpgout|pgmajfault" → 用 pgmajfault(缺页中断)反推读缓存效率(越少越好)
  • 控脏页节奏:
    sysctl -w vm.dirty_ratio=15
    sysctl -w vm.dirty_background_ratio=5
    → 降低触发后台回写的阈值,避免突发写导致阻塞
  • 查某进程用了多少 Page Cache:grep -i "mm\/.*cache" /proc//smaps(含 Shared_Clean/Shared_Dirty
  • 关键提醒:Page Cache 是 per-file 的,多个进程打开同一文件,共享同一组缓存页(mapping 相同),但各自有独立 file->f_pos 偏移 —— 这正是 mmap 共享内存的基础
真正容易被忽略的,是 Page Cache 的“共享性”和“延迟可见性”:你改了一个 mmap 区域,另一个进程立刻能读到新值,不是因为 magic,而是它们访问的是同一个 struct page;而这个页何时落盘,完全由 writeback 策略决定,跟你的 msync() 调用与否、甚至进程是否退出都无必然关系。

相关专题

更多
堆和栈的区别
堆和栈的区别

堆和栈的区别:1、内存分配方式不同;2、大小不同;3、数据访问方式不同;4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容,供大家免费下载体验。

382

2023.07.18

堆和栈区别
堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

567

2023.08.10

线程和进程的区别
线程和进程的区别

线程和进程的区别:线程是进程的一部分,用于实现并发和并行操作,而线程共享进程的资源,通信更方便快捷,切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

478

2023.08.10

数据库三范式
数据库三范式

数据库三范式是一种设计规范,用于规范化关系型数据库中的数据结构,它通过消除冗余数据、提高数据库性能和数据一致性,提供了一种有效的数据库设计方法。本专题提供数据库三范式相关的文章、下载和课程。

340

2023.06.29

如何删除数据库
如何删除数据库

删除数据库是指在MySQL中完全移除一个数据库及其所包含的所有数据和结构,作用包括:1、释放存储空间;2、确保数据的安全性;3、提高数据库的整体性能,加速查询和操作的执行速度。尽管删除数据库具有一些好处,但在执行任何删除操作之前,务必谨慎操作,并备份重要的数据。删除数据库将永久性地删除所有相关数据和结构,无法回滚。

2072

2023.08.14

vb怎么连接数据库
vb怎么连接数据库

在VB中,连接数据库通常使用ADO(ActiveX 数据对象)或 DAO(Data Access Objects)这两个技术来实现:1、引入ADO库;2、创建ADO连接对象;3、配置连接字符串;4、打开连接;5、执行SQL语句;6、处理查询结果;7、关闭连接即可。

346

2023.08.31

MySQL恢复数据库
MySQL恢复数据库

MySQL恢复数据库的方法有使用物理备份恢复、使用逻辑备份恢复、使用二进制日志恢复和使用数据库复制进行恢复等。本专题为大家提供MySQL数据库相关的文章、下载、课程内容,供大家免费下载体验。

253

2023.09.05

vb中怎么连接access数据库
vb中怎么连接access数据库

vb中连接access数据库的步骤包括引用必要的命名空间、创建连接字符串、创建连接对象、打开连接、执行SQL语句和关闭连接。本专题为大家提供连接access数据库相关的文章、下载、课程内容,供大家免费下载体验。

322

2023.10.09

c++主流开发框架汇总
c++主流开发框架汇总

本专题整合了c++开发框架推荐,阅读专题下面的文章了解更多详细内容。

3

2026.01.09

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
PostgreSQL 教程
PostgreSQL 教程

共48课时 | 6.9万人学习

Git 教程
Git 教程

共21课时 | 2.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号