一、磁盘基础知识
磁盘可以划分为多个环,每个环称为一个磁道。每个磁道又被均分为多个扇区,扇区是磁盘I/O操作的基本单位(如果要修改扇区中的一个比特位,必须将整个扇区加载到内存中)。磁盘的盘面、磁道和扇区都有各自的编号。要访问某个扇区的内容,必须通过磁头先定位到特定的磁道(柱面cylinder),然后确定盘面(磁头head),最后确定磁道上的扇区(sector),这种方法称为CHS定位法。
1.1、磁盘逻辑结构的理解 我们可以将磁盘盘面上的每个磁道想象成拉直成一个线性结构。如果将所有磁道和所有盘面拼接在一起,就形成了一个类似磁带的长线性结构。假设磁盘每个盘面的大小为200GB,总共有四个盘面,每个扇区大小为512KB,那么800GB可以被分成1677721600个扇区。如果将这个线性结构视为一个数组,我们可以通过访问扇区对应的数组下标,并通过算法转换为CHS地址来访问该扇区。这种转换工作由磁盘完成。因此,操作系统需要知道磁盘有多少个盘面,每个盘面的大小是多少,每个扇区的大小是多少,每个磁道有多少个扇区。这样,操作系统就可以统一使用线性地址来进行编程,并在访问磁盘数据时将线性地址交给磁盘,由磁盘将其转换为CHS地址,从而实现数据的读取和写入。
二、文件系统底层的实现原理2.1、系统层面的数据块 然而,在操作系统层面上,单次交互一个扇区的数据量被认为过小。文件系统认为I/O操作的基本单位是4KB,即8个扇区(假设)。因此,操作系统和磁盘之间一次最小交换的数据量为8个扇区。操作系统可以将800GB的磁盘重新分块,以8个扇区为一个数据块,第一个数据块的数组下标编号为1,第二个为2,以此类推,这种编址称为LBA地址(Logical Block Address)。当操作系统需要读取或写入某个数据块时,只需将数据块的数组编号乘以8,再加上[0,1,2,3,4,5,6,7],即可找到对应的8个连续扇区。然后将这8个扇区的线性地址交给磁盘,转换为CHS地址,就可以对这8个扇区进行读取或写入。
2.2、分区和分组 我们已经讨论了磁盘和操作系统对存储空间的分块问题,接下来探讨操作系统如何管理这800GB的空间。在实际操作中,操作系统不会将这800GB的空间视为一个整体,而是将其划分为多个分区(如我们常见的C盘、D盘、E盘)。每个分区下又有多个分组,通过对一个分组的管理经验应用到其他分组中(当然也可以应用其他管理经验),从而有效管理所有分区和分组。
Linux磁盘文件特性包括文件内容和文件属性,文件属性包括类型、大小、权限、时间、inode编号等(文件名不属于文件属性)。一个文件的inode编号在其所属分区内是唯一的,系统通过inode编号而非文件名来标识文件。文件的内容和属性是分开存储的。在磁盘中,文件属性存储在struct inode结构体中,大小为128字节。操作系统的数据块大小为4KB(如上所述),因此一个数据块可以存储32个struct inode结构体。
2.3、组的管理模式 为了有效管理每个分组中的10GB空间,系统对其进行了模块化管理。
创建文件时,需要在组的inodeBitmap中从左到右遍历,找到第一个非1的比特位,将其置1,并通过该比特位索引到inodeTable中申请一个struct inode结构体,填写相应的属性。然后在Block Bitmap中找到非1的比特位,置1,并将数据填入对应的Data blocks数据块中。删除文件时,只需将其在inode Bitmap和Block Bitmap中占用的比特位置0,而不需要在磁盘中删除所有数据,这是删除文件比下载文件快得多的原因。每个分区的每个分组都有一个起始编号,struct inode结构体的inode编号可以理解为该分组的起始编号加上在inode Bitmap中的偏移量。这样可以确保一个文件的inode编号在其所属分区内是唯一的。
为了将文件的属性和内容建立联系,struct inode结构体中包含一个int block[15]数组,用来表示该分组内哪些数据块属于该文件。block数组下标[0,11]直接保存Data blocks中的编号(一级索引);[12,13]保存的是其他保存数据的数据块编号(二级索引),[14]保存的是三级索引,这样可以有效增加保存文件数据的数据块数量,从而使一个文件能够保存更多的数据。
三、文件的增删查改 在Linux系统中,目录也是文件,其内容中保存了目录中文件的inode编号和文件名之间的映射关系。这就是为什么如果我们对一个目录没有写入权限,就无法在这个目录中创建文件的原因。因为创建文件需要将文件的inode编号和文件名之间的映射关系写入目录的内容中,本质上是修改目录的内容,而操作系统不允许我们进行这种修改。删除文件时,首先通过文件名在当前目录中进行字符串匹配,匹配成功后,将所在分组的inodebitmap和blockbitmap中对应的比特位置0,然后从目录的内容中删除文件名和inode的映射关系,这样文件就被删除了。
四、文件路径 查找文件时,内核会递归地帮助我们找到根目录,从根目录开始解析路径。因为要获取文件的内容,首先需要获取其inode编号,但我们只有文件名。文件名和inode编号存储在文件所在的目录中,因此需要在目录的内容中查找。但是我们也只知道目录名,所以需要继续查找上级目录的inode编号,依此类推,直到找到根目录。根目录的inode编号是系统已知的,因此我们可以逆向找到所有目录的inode编号,从而找到目标文件的inode编号,进而获取文件内容。这就是文件路径最根本的作用。
五、挂载的理解 挂载(Mounting)是指操作系统使存储设备(如硬盘、CD-ROM或网络共享)上的文件和目录可供用户通过文件系统访问的过程。一个写入文件系统的分区要被Linux操作系统使用,必须挂载到一个目录下。分区的访问都是通过挂载路径进行的。通过文件路径的前缀可以知道文件所在的分区。
以上就是【Linux】详解文件系统以及周边知识的详细内容,更多请关注php中文网其它相关文章!
每个人都需要一台速度更快、更稳定的 PC。随着时间的推移,垃圾文件、旧注册表数据和不必要的后台进程会占用资源并降低性能。幸运的是,许多工具可以让 Windows 保持平稳运行。
Copyright 2014-2025 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号