0

0

【Linux】理解文件系统

看不見的法師

看不見的法師

发布时间:2025-06-19 17:07:37

|

605人浏览过

|

来源于php中文网

原创

?1. 了解磁盘

  磁盘是一种用于存储数据的媒介。具体来说,磁盘是由一个或多个圆盘组成的,每个圆盘都包含一个或多个磁性表面。通过将数据以磁性方式写入磁盘表面,可以将数据存储在其中。

【Linux】理解文件系统

  磁盘通常被用作计算机系统的主要存储介质,用于存储操作系统、应用程序和用户数据。磁盘提供了比内存更大的存储容量,因此可以存储更多的数据。

✨磁盘物理结构

  磁盘的工作原理是通过读/写头在磁盘表面上读取/写入数据。读/写头会在磁盘上的特定位置上产生磁场,以读取或写入数据。数据的读取和写入速度取决于磁盘的转速、读/写头的定位速度和磁盘的接口速度,如下图所示:

【Linux】理解文件系统
✨磁盘存储结构首先磁盘有多个盘片,每片有两面,每面都有一个磁头进行写入/读取数据:
【Linux】理解文件系统
其次每个盘片上都会根据半径划分为多个磁道,每个磁道都会被划分成一个个的扇区,方便管理:
【Linux】理解文件系统

扇区是磁盘存储数据的基本单位,一个扇区对应的大小一般是512字节。

我们可以通过sudo fdisk -l /dev/vda命令来查看磁盘中扇区的个数:

【Linux】理解文件系统

所以可以通过定位一个扇区来在磁盘指定位置进行读写操作。如图所示:

【Linux】理解文件系统
磁盘容量 = 磁头数*磁道数*每道扇区数*每个扇区的字节
✨CHS地址定位

 如何定位一个扇区?

先定位磁道也就是确定在哪一个柱面(柱面是由半径相同的磁道组成的)(Cylinder)再确定磁面,由磁头决定(Head)最后定位扇区(Sector)✨LBA地址定位

  LBA是一种用于描述磁盘上数据位置的线性格式,它通过一个简单的数字来表示柱面、磁头和扇区的组合。LBA地址是从磁盘的起始位置开始计算,并且相对于物理结构更加简单和直观。

例如我们常见的磁带:

【Linux】理解文件系统

那么对于磁盘上的扇区,我们也可以抽象成线性结构:

【Linux】理解文件系统

这样每个扇区就有了一个线性地址(其实就是数组下标),这种地址就叫做LBA(Logical Block Addressing)。

LBA地址计算方式:

CHS转换LBA:
LBA = 柱面号C*单个柱面总扇区数 + 磁道号 H*每磁道扇区数 + 扇区号S -1
LBA转换CHS:
柱面号C = LBA // 单个柱面扇区总数
磁道号H = (LBA \% 单个柱面扇区总数) // 每磁道扇区数
扇区号S = (LBA \% 每磁道扇区数) + 1

相比于CHS地址,LBA地址具有以下优势:

简单和直观:LBA地址是一个连续的线性数字,更易于理解和计算。更高的容量:由于磁盘容量的不断增加,传统的chs地址已经无法满足需要,而LBA地址可以支持更大的磁盘容量。兼容性:由于现代操作系统和硬件广泛支持LBA地址,它更适合与各种系统和设备进行兼容。

所以磁盘使用者就可以不用关心CHS地址,而直接使用LBA地址,让磁盘内部自己转换。

?2. 文件系统

  在操作系统与磁盘之间进行IO交换时,以扇区为基本单位,512字节,但是单次IO的数据量有些少,所以通常一次IO会加载4KB的数据块,也就是8个扇区的大小,所以磁盘就可以抽象为以块为单位的一维数组:

AMiner
AMiner

AMiner——新一代智能型科技情报挖掘与服务系统,能够为你提供查找论文、理解论文、分析论文、写作论文四位一体一站式服务。

下载
【Linux】理解文件系统
✨磁盘管理分区 对于几百GB的磁盘,为了进行有效的管理和维护,提高稳定性,我们通常会对磁盘进行分区管理:将物理磁盘划分为一个或多个逻辑分区,每个分区可以独立使用,并可以有不同的文件系统。分组 仅仅依靠分区,还不能很好的管理磁盘,所以需要在此基础上进行分组,这样只要管理好一个组,其他组就可以依照该组进行管理,这样整个区就管理好了。
【Linux】理解文件系统
Super Block(超级块): 存放文件系统本身的结构信息。GDT,Group Descriptor Table (块组描述符) : 描述块组属性信息Block Bitmap(块位图) : Block Bitmap中记录着Data Block中哪个数据块已经被占用,哪个数据块没有被占用inode Bitmap(inode位图) : 每个bit表示一个inode是否空闲可用inode Table (i节点表) : 存放文件属性 如 文件大小,所有者,最近修改时间等Data blocks(数据区) : 存放文件内容✨inode

  inode是描述文件属性(注意inode里面不包含文件名信息)的结构体,每个文件和目录在文件系统中都有一个唯一的inode号码,用于标识和索引文件:

代码语言:javascript代码运行次数:0运行复制
struct inode{//inode编号//文件大小//创建时间//文件所有者//文件权限//...}

我们可以通过命令ls -l -i来查看文件的inode编号:

【Linux】理解文件系统

inode编号个数以及block个数在磁盘初始化时就已经固定了:

一个分区拥有一套inodeinode分配只需确定起始inode即可

如下图所示:

【Linux】理解文件系统

struct inode中保存了与该文件数据块之间的映射关系,所以我们仅需知道文件的inode值,在inode Table 中找到对应的属性集,然后根据属性集里inode与data blocks之间的映射表,就可以找到相应文件的内容啦:

【Linux】理解文件系统

struct inode 与 Data block之间映射:

  当文件被创建时,文件系统会为该文件分配一个或多个数据块,并将这些数据块的编号存储在文件的inode中。这样,当需要读取或写入文件时,文件系统可以通过inode中存储的数据块编号找到相应的数据块。这种映射关系可以通过直接映射、间接映射和多级间接映射等方式来实现。

直接映射(Direct Mapping):文件的每个数据块的编号直接存储在inode中。这种方式适用于小文件,但对于大文件来说,inode的大小会变得很大,占用额外的存储空间。 间接映射(Indirect Mapping):文件的inode中存储一个指向间接块(indirect block)的指针。间接块中存储了多个数据块的编号。这种方式可以节省inode的空间,但需要额外的访问间接块来获取数据块的编号。 多级间接映射(Multilevel Indirect Mapping):类似于间接映射,但是可以使用多级索引来进一步减少inode的大小。比如,一级间接块中存储了多个二级间接块的指针,二级间接块中存储了多个三级间接块的指针,以此类推。

✨重新理解新建文件与删除文件

新建文件在inode Bitmap中查找未被使用的位置,例如找到了第7个比特位没被使用,那么就将其分配给新建的文件作为inode值,再将该比特位由0置1找到位图对应的inode Table中第7个位置,将新建文件的属性信息填到表中该位置的struct inode中,属性信息包括inode编号,创建时间,所属组,拥有者等然后根据新建文件的内容,比如写入一个hello world!,根据内容分配一定大小的空间,然后在Block Bitmap中找到未被使用的块,将其由0置1,表明该位置从现在开始已经被占用;然后根据位图找到与之对应的Data blocks数据块写入hello world!在struct inode中建立与数据块之间的映射关系删除文件

  只需通过文件inode编号找到对应的inode Bitmap和Block Bitmap中相应位置由1置为0,表明该位置已经没有数据即可。

为什么文件名不在struct inode属性信息中保存?

  文件名保存在目录中,目录也是一个文件,也有自己的inode编号,该文件的数据块中保存的就是该目录下创建的文件名与inode编号之间的映射关系,所以目录也能打开,内容如图所示:

【Linux】理解文件系统
✨struct dentry

  有了目录中保存文件的inode以及文件名之后,我们要想打开一个文件比如test.c就必须先找到保存该文件inode的目录,然后根据inode编号去磁盘中寻找,但是目录也是一个文件,要想打开该目录必须得找到保存该目录inode编号的目录,以此类推一直找到根目录,而根目录的inode编号是固定的,所以我们就可以根据根目录的内容再往下一层一层找到test.c文件的inode编号。   当还需要打开同一级目录下的另一个文件时,如果还需要这样一层一层的路径解析,未免太过浪费时间,空间,所以linux系统通过struct dentry内核数据结构对路径结构进行缓存,这样就不需要一直与磁盘进行IO交互了

struct dentry的主要成员包括:

d_inode:指向该目录项对应的inode的指针。inode是文件系统中一个文件的元数据结构,包含了文件的权限、大小、创建时间等信息。 d_parent:指向该目录项的父目录的dentry的指针。通过d_parent可以获取到该目录项所在的目录。 d_name:目录项的名称,以struct qstr的形式表示。struct qstr包含了目录项名称的字符串指针和长度信息。
【Linux】理解文件系统

相关专题

更多
js获取数组长度的方法
js获取数组长度的方法

在js中,可以利用array对象的length属性来获取数组长度,该属性可设置或返回数组中元素的数目,只需要使用“array.length”语句即可返回表示数组对象的元素个数的数值,也就是长度值。php中文网还提供JavaScript数组的相关下载、相关课程等内容,供大家免费下载使用。

557

2023.06.20

js刷新当前页面
js刷新当前页面

js刷新当前页面的方法:1、reload方法,该方法强迫浏览器刷新当前页面,语法为“location.reload([bForceGet]) ”;2、replace方法,该方法通过指定URL替换当前缓存在历史里(客户端)的项目,因此当使用replace方法之后,不能通过“前进”和“后退”来访问已经被替换的URL,语法为“location.replace(URL) ”。php中文网为大家带来了js刷新当前页面的相关知识、以及相关文章等内容

374

2023.07.04

js四舍五入
js四舍五入

js四舍五入的方法:1、tofixed方法,可把 Number 四舍五入为指定小数位数的数字;2、round() 方法,可把一个数字舍入为最接近的整数。php中文网为大家带来了js四舍五入的相关知识、以及相关文章等内容

754

2023.07.04

js删除节点的方法
js删除节点的方法

js删除节点的方法有:1、removeChild()方法,用于从父节点中移除指定的子节点,它需要两个参数,第一个参数是要删除的子节点,第二个参数是父节点;2、parentNode.removeChild()方法,可以直接通过父节点调用来删除子节点;3、remove()方法,可以直接删除节点,而无需指定父节点;4、innerHTML属性,用于删除节点的内容。

478

2023.09.01

JavaScript转义字符
JavaScript转义字符

JavaScript中的转义字符是反斜杠和引号,可以在字符串中表示特殊字符或改变字符的含义。本专题为大家提供转义字符相关的文章、下载、课程内容,供大家免费下载体验。

434

2023.09.04

js生成随机数的方法
js生成随机数的方法

js生成随机数的方法有:1、使用random函数生成0-1之间的随机数;2、使用random函数和特定范围来生成随机整数;3、使用random函数和round函数生成0-99之间的随机整数;4、使用random函数和其他函数生成更复杂的随机数;5、使用random函数和其他函数生成范围内的随机小数;6、使用random函数和其他函数生成范围内的随机整数或小数。

1031

2023.09.04

如何启用JavaScript
如何启用JavaScript

JavaScript启用方法有内联脚本、内部脚本、外部脚本和异步加载。详细介绍:1、内联脚本是将JavaScript代码直接嵌入到HTML标签中;2、内部脚本是将JavaScript代码放置在HTML文件的`<script>`标签中;3、外部脚本是将JavaScript代码放置在一个独立的文件;4、外部脚本是将JavaScript代码放置在一个独立的文件。

658

2023.09.12

Js中Symbol类详解
Js中Symbol类详解

javascript中的Symbol数据类型是一种基本数据类型,用于表示独一无二的值。Symbol的特点:1、独一无二,每个Symbol值都是唯一的,不会与其他任何值相等;2、不可变性,Symbol值一旦创建,就不能修改或者重新赋值;3、隐藏性,Symbol值不会被隐式转换为其他类型;4、无法枚举,Symbol值作为对象的属性名时,默认是不可枚举的。

553

2023.09.20

Java编译相关教程合集
Java编译相关教程合集

本专题整合了Java编译相关教程,阅读专题下面的文章了解更多详细内容。

5

2026.01.21

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
MongoDB 教程
MongoDB 教程

共17课时 | 2.2万人学习

XML教程
XML教程

共142课时 | 5.7万人学习

php-src源码分析探索
php-src源码分析探索

共6课时 | 0.5万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号