Linux存储系统原理解析_数据读写流程说明【教程】

舞夢輝影

发布时间：2026-01-02 15:34:03

731人浏览过

来源于php中文网

原创

VFS层将write()系统调用统一转为对inode和page cache的操作，屏蔽文件系统差异；数据仅在调用fsync()/sync()后才落盘，否则停留于内存脏页，由writeback线程按dirty_ratio阈值异步刷回。

linux存储系统原理解析_数据读写流程说明【教程】

数据写入时，VFS 层到底做了什么

Linux 写操作不会直接触达磁盘，而是先经过 VFS（Virtual File System）抽象层。它把 write() 系统调用统一转成对 inode 和 page cache 的操作，屏蔽了 ext4、XFS、Btrfs 等具体文件系统的差异。

关键点在于：只要没显式调用 fsync() 或 sync()，数据就只停留在内存的 page cache 中，尚未落盘。

write() 返回成功 ≠ 数据已写入磁盘
脏页（dirty page）由内核线程 pdflush（旧内核）或 writeback（4.0+）异步刷回
/proc/sys/vm/dirty_ratio 和 /proc/sys/vm/dirty_background_ratio 控制刷盘触发阈值

ext4 文件系统如何分配磁盘块

ext4 使用 extent（连续块描述）替代早期 ext2/3 的间接块指针，在大文件场景下显著减少元数据开销。一个文件的物理布局由 inode 中的 i_block[] 数组 + extent tree 共同描述。

当需要新块时，ext4 优先在同一个 block group 内分配，以提升局部性；若空间不足，则触发跨 group 搜索，并可能触发 lazy initialization（如未格式化的 block group 被跳过初始化）。

每个 block group 包含自己的 bitmap、inode table 和 data blocks，避免全局锁争用
使用 chattr +e 可强制启用 extent 模式（新建文件默认已启用）
碎片严重时，e2fsck -D 可重建目录索引，但不整理文件数据块

从 write() 到磁盘扇区：IO 栈逐层穿透

用户态 write() 发起后，路径为：libc → syscall → VFS → filesystem (ext4) → block layer → device driver → disk firmware。其中 block layer 是关键枢纽，负责 IO 合并、排序、限速和队列调度。

Amazon Nova

亚马逊云科技（AWS）推出的一系列生成式AI基础模型

下载

常见误区是认为“写得快 = 磁盘快”，其实瓶颈常卡在 block layer 的 queue depth 或 scheduler 策略上：

SSD 推荐用 none 或 mq-deadline 调度器，避免传统电梯算法引入额外延迟
cat /sys/block/sda/queue/scheduler 查看当前调度器，echo mq-deadline > /sys/block/sda/queue/scheduler 可临时切换
NVMe 设备默认使用 none（即 bypass scheduler），但部分老内核需手动设置

echo 'vm.dirty_ratio = 30' >> /etc/sysctl.conf
echo 'vm.dirty_background_ratio = 5' >> /etc/sysctl.conf
sysctl -p

读取时 page cache 命中与绕过的条件

read() 默认走 page cache 路径：先查该文件对应 offset 是否已在内存中；命中则直接拷贝，不发磁盘 IO。但以下情况会绕过 cache：

打开文件时指定 O_DIRECT 标志，要求 kernel bypass page cache，直接与设备驱动交互
使用 posix_fadvise(fd, offset, len, POSIX_FADV_DONTNEED) 主动丢弃缓存页
内存紧张时，kernel 可能回收 clean page（未修改的缓存页），下次读仍需 IO

O_DIRECT 要求用户缓冲区地址、偏移、长度均按 logical_block_size 对齐（通常是 512B 或 4K），否则 write() 返回 -EINVAL。

实际调试时，strace -e trace=write,read,fsync 和 blktrace -d /dev/sda 能清晰区分是应用层逻辑问题，还是底层 IO 调度或硬件响应慢。page cache 的存在让“读写快”变得廉价，但也让“数据持久性”变成需要主动管理的事。

Linux系统维护周期管理_持续优化思路说明【指导】

Linux系统稳定性保障方案_服务监控设计思路【教程】

Linux端口监听状态分析_服务暴露风险说明【教程】

Linux日志收集项目教程_FilebeatLogstashELK整合实践

Linux内核参数如何调整_sysctl优化思路解析【技巧】

相关标签:

linux node 栈 pdf echo Filesystem 指针栈线程 len 异步 table 算法 linux

本站声明：本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系admin@php.cn

上一篇：LinuxShell基础如何学习_脚本语法与执行流程解析【教程】下一篇：Linux启动流程怎么分析_从BIOS到系统就绪详解【指导】

作者最新文章

网吧可以查看电脑日志吗_网吧电脑系统日志查看权限及方法

2025-12-31 08:23

如何查看电脑显卡温度

2025-12-31 09:09

新加坡签证查询进度查询中文网

2025-12-31 09:19

如何在 Excel 中分隔名字和姓氏

2025-12-31 09:19

坐飞机流程及注意事项小白

2025-12-31 09:27

小红书网页版直播在哪

2025-12-31 09:29

腾讯视频会员如何扫码登录_腾讯视频会员如何扫码登录最全微信QQ教程2026

2025-12-31 10:06

手机淘宝绑定银行卡安全吗？淘宝直接绑定银行卡有风险吗

2025-12-31 10:10

去哪儿旅行机票查询_去哪儿旅行机票查询官网入口

2025-12-31 10:28

中文简繁体转换程序官网_中文简繁体在线转换官方入口

2025-12-31 10:31

热门AI工具

DeepSeek

幻方量化公司旗下的开源大模型平台

AI大模型

开放平台

豆包大模型

字节跳动自主研发的一系列大型语言模型

AI大模型

通义千问

阿里巴巴推出的全能AI助手

AI大模型

腾讯元宝

腾讯混元平台推出的AI助手

文档处理

Excel 表格

文心一言

文心一言是百度开发的AI聊天机器人，通过对话可以生成各种形式的内容。

AI大模型

中文写作

讯飞写作

基于讯飞星火大模型的AI写作工具，可以快速生成新闻稿件、品宣文案、工作总结、心得体会等各种文文稿

中文写作

写作工具

即梦AI

一站式AI创作平台，免费AI图片和视频生成。

图片拼接

图画生成

ChatGPT

最最强大的AI聊天机器人程序，ChatGPT不单是聊天机器人，还能进行撰写邮件、视频脚本、文案、翻译、代码等任务。

AI大模型

中文写作

智谱清言 - 免费全能的AI助手

AI大模型

PDF 文档

相关专题

堆和栈的区别

堆和栈的区别：1、内存分配方式不同；2、大小不同；3、数据访问方式不同；4、数据的生命周期。本专题为大家提供堆和栈的区别的相关的文章、下载、课程内容，供大家免费下载体验。

373

2023.07.18

堆和栈区别

堆(Heap)和栈(Stack)是计算机中两种常见的内存分配机制。它们在内存管理的方式、分配方式以及使用场景上有很大的区别。本文将详细介绍堆和栈的特点、区别以及各自的使用场景。php中文网给大家带来了相关的教程以及文章欢迎大家前来学习阅读。

563

2023.08.10

线程和进程的区别

线程和进程的区别：线程是进程的一部分，用于实现并发和并行操作，而线程共享进程的资源，通信更方便快捷，切换开销较小。本专题为大家提供线程和进程区别相关的各种文章、以及下载和课程。

473

2023.08.10

线程和进程的区别

473

2023.08.10

页面置换算法

页面置换算法是操作系统中用来决定在内存中哪些页面应该被换出以便为新的页面提供空间的算法。本专题为大家提供页面置换算法的相关文章，大家可以免费体验。

389

2023.08.14

磁盘配额是什么

磁盘配额是计算机中指定磁盘的储存限制，就是管理员可以为用户所能使用的磁盘空间进行配额限制，每一用户只能使用最大配额范围内的磁盘空间。php中文网为大家提供各种磁盘配额相关的内容，教程，供大家免费下载安装。

1345

2023.06.21

如何安装LINUX

本站专题提供如何安装LINUX的相关教程文章，还有相关的下载、课程，大家可以免费体验。

700

2023.06.29

linux find

find是linux命令，它将档案系统内符合 expression 的档案列出来。可以指要档案的名称、类别、时间、大小、权限等不同资讯的组合，只有完全相符的才会被列出来。find根据下列规则判断 path 和 expression，在命令列上第一个 - ( ) , ! 之前的部分为 path，之后的是 expression。还有指DOS 命令 find，Excel 函数 find等。本站专题提供linux find相关教程文章，还有相关

294

2023.06.30