Linux系统 2023-08-03

深入了解Linux文件系统实验原理 (linux文件系统实验原理)

Linux是一个开源的操作系统，广泛应用于各种领域。Linux文件系统是其中一个重要的组成部分，它的实现原理影响着Linux系统的性能和稳定性。本文将介绍Linux文件系统的实现原理，并介绍一个简单的实验，帮助读者深入理解文件系统的工作方式。

一、Linux文件系统概述

Linux文件系统是指在Linux操作系统中负责存储和管理文件的一组软件程序和数据结构。在Linux系统中，文件系统使用一种树形结构来组织文件和目录，这个树形结构称为目录树。目录树的顶层是根目录，其他目录和文件都存放在根目录下或者它的子目录里。

文件系统的实现原理是在一个物理设备（通常是硬盘）上划分一块空间，然后在这个空间上创建一个或多个文件系统，每个文件系统对应着一个根目录。文件系统中包含多个文件和目录，它们以一定的方式存储在设备上。当我们打开一个文件或者创建一个新文件时，文件系统会将文件所在的数据块读入内存，我们在内存中编辑或读取文件，当我们关闭文件或者保存文件时，数据块会被写回到设备上。

二、Linux文件系统实验原理

在Linux系统中，每个设备都有一个设备文件，例如硬盘的设备文件是/dev/hda，其中hda表示硬盘的之一块物理分区。我们可以通过在设备文件上创建一个文件系统，实现在硬盘上创建并管理文件的目的。下面介绍一个简易的Linux文件系统实验，帮助读者了解文件系统的实现原理。

1. 准备工作

我们需要一个空白的硬盘分区，可以使用如下命令查看硬盘的分区情况：

fdisk -l

然后选择一个空白的分区（例如/dev/hda2），用如下命令格式化分区并创建文件系统：

mkfs.ext2 /dev/hda2

2. 挂载分区

接下来，我们需要在Linux系统中挂载分区，使得文件系统可以访问。我们可以使用如下命令创建一个挂载点：

mkdir /mnt/myfs

然后，可以使用如下命令将分区挂载到该挂载点上：

mount /dev/hda2 /mnt/myfs

3. 测试文件系统

我们可以使用如下命令测试文件系统：

cd /mnt/myfs

touch myfile.txt

echo “Hello World” > myfile.txt

cat myfile.txt

这些命令完成了以下操作：

– 进入文件系统的根目录。

– 创建了一个名为myfile.txt的文件。

– 将字符串“Hello World”写入myfile.txt文件。

– 用cat命令读取myfile.txt文件并在屏幕上显示。

通过测试命令，我们可以看到在/mnt/myfs目录下创建了一个名为myfile.txt的文件，文件内容是字符串“Hello World”。

4. 卸载文件系统

当我们不再需要使用文件系统时，我们需要卸载文件系统，以便安全地卸载硬盘分区。我们可以使用如下命令卸载文件系统：

umount /mnt/myfs

这个命令会将/mnt/myfs目录下的文件系统从/dev/hda2设备上卸载。

三、结论

Linux文件系统是一个重要的组成部分，它存储和管理着Linux系统中的文件和目录。本文介绍了Linux文件系统的实现原理，并通过一个简单的实验帮助读者加深对文件系统工作方式的理解。我们了解到，文件系统的实现原理是在一个物理设备上划分出一块空间，并在空间上创建一个或多个文件系统，每个文件系统对应一个根目录。当我们打开、读取、保存或关闭文件时，文件系统会将数据块读入内存，我们在内存中编辑文件，数据块会被写回到设备上。通过这篇文章，读者可以更好地理解Linux文件系统的工作原理。

相关问题拓展阅读：

Linux文件系统特点？
程序员必备知识（操作系统5-文件系统）

Linux文件系统特点？

Linux之所以能在嵌人式系统领域取得如此辉煌的成绩，与其自身的优良特性是分不开的。与其他操作系统相比，Linux具有以下一系列显著的特点。

1．模块化程度高

Linux的内核设计非常精巧，分成进程调度、内存管理、进程间通信、虚拟

文件系统

和网络接口五大部分；其独特的模块机制可根据用户的需要，实时地将某些模块插入或从内核中移走，使得Linux系统内核可以裁剪得非常小巧，很适合于

嵌入式系统

的需要。

2．源码公开

由于Linux系统的开发从一开始就与GNU项目紧密地结合起来，所纳历以它的大多数组成部分都直接来自GNU项目。任何人、任何组织只要遵守GPL条款，就可以自由使用Linux

源代码

，为用户提供了更大限度的

自由度

。这一点也正投嵌入式系统所好，因为嵌入式系统应用千差万别，设计者往往需要针对具体的应用对源码进行修改和优化，所以是否能获得源代码对于嵌入式系统的开发是至关重要的。加之Linux的软件资源十分丰富，每种通用程序在Linux上几乎都可以找到，并且数量还在不断增加。这一切就使设计者在其基础之上进行二次开发变得非常容易。另外，由于Linux源代码公开，也使用户不用担心有“后闸”等

安全隐患

。

同时，源码开放给各教育机构提供极大的方便，从而也促进了Linux的学习、推广和应用。

3．广泛的硬件支持

Linux能支持x86、ARM、MIPS、ALPHA和PowerPC等多种体系结构的洞备搜

微处理器

。目前已成功地移植到数十种硬件平台，几乎能运行在所有流行的处理器上。

由于世界范围内有众多开发者在为Linux的扩充贡献力量，所以Linux有着异常丰富的

驱动程序

资源，支持各种主流硬件设各和最新的硬件技术，甚至可在没有存储管理单元MMU 的处理器上运行，这滚让些都进一步促进了Linux在嵌入式系统中的应用。

4．安全性及可靠性好

内核高效稳定。

Linux内核

的高效和稳定已在各个领域内得到了大量事实的验证。

Linux中大量网络管理、网络服务等方面的功能，可使用户很方便地建立高效稳定的防火墙、路由器、工作站、服务器等。为提高安全性，它还提供了大量的网络管理软件、网络分析软件和网络安全软件等。

5．具有优秀的开发工具

开发嵌入式系统的关键是需要有一套完善的开发和调试工具。传统的

嵌入式开发

调试工具是在线仿真器（In Circuit Emulator，ICE），它通过取代目标板的微处理器，给目标程序提供一个完整的仿真环境，从而使开发者能非常清楚地了解到程序在目标板上的工作状态，便于监视和调试程序。在线仿真器的价格非常高，而且只适合做非常底层的调试。如果使用的是嵌人式Linux，一旦软硬件能支持正常的串口功能，即使不用在线仿真器，也可以很好地进行开发和调试工作，从而节省了一笔不小的开发费用。嵌入式Linux为开发者提供了一套完整的工具链（Tool Chain），能够很方便地实现从操作系统到应用软件各个级别的调试。

6．有很好的网络支持利文件系统支持

Linux从诞生之日起就与Internet密不可分，支持各种标准的Internet

网络协议

，并且很容易移植到嵌入式系统当中。目前，Linux几乎支持所有主流的网络硬件、网络协议和文件系统，因此它是NFS的一个很好的平台。

另一方面，由于Linux有很好的文件系统支持（例如，它支持Ext2、FAT32、romfs等文件系统），是数据各份、同步和复制的良好平台，这些都为开发嵌入式系统应用打下了坚实的基础。

7．与UNIX完全兼容

目前，在Linux中所包含的工具和实用程序，可以完成UNIX的所有主要功能。

但由于Linux不是为实时而设计的，因而这就成了Linux在实时系统中应用的更大遗憾。不过，目前有众多的自由软件爱好者正在为此进行不懈的努力，也取得了诸多成果

类似于 Windows下的C、D、E等各个盘，Linux系统也可以将磁盘、Flash等存储设备划分为若干个分区，在不同分区存放不同类别的文件。与Windows的C盘类似，Linux一样要在一个分区上存放系统启动所必需的文件，比如内核映象文件（在嵌入式系统中，内核一般单独存放在一个分区中)内核启动后运行的之一-个程序( init)给用户提供操作界面的 shell程序、应用程序所依赖的库等。这些必需、基本的文件早氏合称为根文件系统，它们存放在一个分区中。Linux 系统启动后首先挂接这个分区，称为挂接( mount）根文件系统。其他分梁睁数区上所有目录、文件的，也称为文件系统。Linux 中并没有C、D、E等盘符的概念，它以树状结构管理所有目录、文件，其他分区挂接在某个目录上，这个目录被称为挂接点或安装点(mount point)，然后就可以通过这个目录来访问这个分区上的文件了。比如根文件系统被挂接在根目录“I”上后，在根目录下就有根文件系统的各个目录、文件:/bin、/in、/mnt等;再将其他分区挂接到/mnt目录上，/mnt目录下就有这个分区.的各个目录、文件。在一个分区上存储文件时，需要遵循一定的格式，这种格式称为文橡首件系统类型，比如fat16、fat32、ntfs、ext2、ext3、jffs2、yaffs 等。除这些拥有实实在在的存储分区的文件系统类型外，Linux还有几种虚拟的文件系统类型，比如proc、sysfs 等，它们的文件并不存储在实际的设备上，而是在访问它们时由内核临时生成。比如 proc文件系统下的uptime文件，读取它时可以得到两个时间值（用来表示系统启动后运行的秒数、空闲的秒数)，每次读取时都由内核即刻生成，每次读取结果都不一样。“文件系统类型”常被简称为“文件系统”,比如“硬盘第二个分区上的文件系统是EXT2”指的就是文件系统类型。所以“文件系统”这个术语，有时候指的是分区上的文件，有时候指的是文件系统类型，需要根据语境分辨，在阅读各类文献时需要注意这点。

第9章 Linux文件系统知识与格式化应用实践… 1

9.1 Linux文件系统介绍… 2

9.1.1文件系统知识预备… 2

9.1.2什么是文件系统？… 3

9.1.3文件系统有什么用？… 3

9.1.4 常见文件系统类型介绍… 3

9.1.5文件系统的深入体系结构介绍… 9

9.1.6操作系统默认文件系统及简单对比… 11

9.1.7文件系统选型简单介绍… 12

9.2 mkfs：创建Linux文件系统核心命令… 13

9.2.1 命令详解… 13

9.2.2 使用范例… 14

9.3 Ext2文件系统介绍… 16

9.3.1 ext2文件系统介绍… 16

9.3.2 ext2文件系统知识回顾… 16

9.3.3什么是inode？… 18

9.3.4什么是逻辑块(Block)？… 21

9.4文件系统的磁盘布局… 22

9.4.1磁盘文件系统概述… 22

9.4.2 ext2文件系统总体存储布局… 23

9.3.1文件系统新增文件操作流程… 36

9.3.2文件系统删除原理… 37

9.1 Linux文件系统介绍

9.1.1文件系统知识预备

分区与文件系统的关系比喻：分区就是给房子打隔断，创建文件系统就是给房子装修！

根据前面课程的讲解，以及大家日常对Linux系统的操作，我们很容易理解，当通过fdisk命令对一个磁盘进行分区后，并不能直接挂载目录存放数据实体，还需要格式化操作，才可以进行挂载并存放数据。这谈轿里实践下，将一个未进行格式化的分区sdb1直接挂载。

# mount /dev/sdb1 /mnt

mount: you must specify the filesystem type #

# mount /dev/sdb1 /mnt

mount: /dev/sdb3 is write-protected, mounting read-only #

mount: unknown filesystem type ‘(null)’

为什么磁盘分区后需要格式化呢？这是因为磁盘分区在没有格式化前，操作系统是无法识别系统上磁盘分区格式的，也就无法存取文件目录属性和权限等内容，把分区格式化成操作系统支持的某个文件系统后，再存放数据，系统就会根据这个文件系统的格式进行存取文件了。

9.1.2什么是文件系统？

简单地说，文件系统就是一种存储和组织计算机中数据文件的机制或方法，它使得对计算机内的数据的存储、访问和查找变得更容易、简单含慎肆。如ext2、ext3(CentOS5.x)、ext4(CentOS6.x)、xfs(CentOS7.x)、zfs和Reiserfs或FAT、NTFS等都是常见文件系统。

文件系统也可能是一种访问数据的服务形式，实际的数据是通过网络协议（如NFS、MFS等）提供的或者系统内存里，甚至可能根本没有对应的文件（如proc文件系统）。

因此，如果严格地说，文件系统是一套实现了数据的存储、分级组织、访问和获取等操作的抽象数据类型，而文件系统落到计算机里其实就是一个应用软件。

9.1.3文件系统有什么用？

文件系统使用文件和树形目录的抽象逻辑概念代替了磁盘等物理设备使用数据块的概念，用户使用文件系统来存放数据，而不必关心数据实际保存在硬盘（或者光盘）的地址为多少的inode和block上，只需要记住这个文件的所属目录和文件名就好了。

在向磁盘分区写入新数据之前，用户不必关心硬盘上的哪个索引节点和块地址有没有被使用，硬盘上的存储空间管理（分配和释放）功能都是由文件系统自动帮用户完成的，用户只需要记住数据被写入到了哪个文件中或文件放于哪个目录中即可。

在磁盘实际工作场景，即使给磁盘分区了，但如果没有在磁盘格式化创建文件系统，那么磁盘是无法存储数据的。因此，在磁盘分区后能够使用之前必须要格孝悄式化成相应的文件系统才行。

9.1.4 常见文件系统类型介绍

随着Linux系统的不断发展，它所支持的文件系统格式也在迅速增多，当今的Linux系统核心可以支持多种文件系统类型：如Btrfs、JFS、ReiserFS、ext、ext2、ext3、ext4、ISO9660、XFS、Minx、MSDOS、UMSDOS、VFAT、NTFS、HPFS、NFS、B、SysV、PROC等还有一种文件系统是Filesystem in Userspace（FUSE）。它可以将文件系统的请求通过VFS虚拟文件系统发送回用户空间。很多分布式文件系统例如：MFS就支持FUSE挂载的方式。。下表是一些常见文件类型的全称、简称和基本用途对应：

Linux支持的每个文件系统都有自己的优缺点和性能特征。文件系统的一个重要属性是日志功能，它允许系统在崩溃后更快地恢复。通常，日志文件系统比非日志文件系统在数据保护方面会更好一些。

1.ext2 文件系统

也称为第二扩展文件系统（英语：second extended filesystem，缩写为 ext2），目的是克服早期 Linux 版本中使用的Minix文件系统的缺点。多年来，该文件系统一直广泛应用于Linux。但 ext2 中没有日志，现在基本上已被ext3（Centos5.x默认的文件系统）取代，ext3文件系统也正逐渐被ext4取代（Centos6.x默认的文件系统）。

ext2开始由Rémy Card设计，用以代替ext，于1993年1月加入linux核心支持之中。ext2的经典实现为LINUX内核中的ext2fs文件系统驱动，更大可支持2TB的文件系统，至linux核心2.6版时，扩展到可支持32TB。其他的实现包括GNU Hurd, Mac OS X (第3方), Darwin (第3方), BSD。ext2为数个LINUX发行版的默认文件系统，如Debian、Red Hat Linux、Centos等。

2.ext3 文件系统

为了避免上述提到的ext2文件系统不一致的情况发生，人们想到了一个方式，在filesystem当中规划出一个区块，该区块专门记录写入或修订文件时的步骤，就可以简化一致性检查的步骤了。也就是说：

1）预备：当系统要写入一个文件时，会先在日志记录区块中记录某个文件准备要写入的信息；

2）实际写入：开始写入档案的权限与数据；开始更新metadata的数据；

3）结束：完成数据与metadata的更新后，在日志记录区块当中完成该档案的记录。

在这样的程序当中，万一数据的记录过程当中収发生了问题，那么我们的系统只要去检查日志记录区块，就可以知道那个文件发生了问题，针对该问题来做一致性的检查即可，而不必针对整块 filesystem 去检查，这样就可以达到快速修复filesystem的能力了！这就是日志式文件系统最基础的功能。

Ext3就是日志文件系统，Ext3是Ext2的升级版本，并且可以向下兼容Ext2。目前建议大家直接使用Ext3这个文件系统。

ext3文件系统向标准ext2文件系统添加了日志功能，因此是一个非常稳定的文件系统的一个演化发展。它在大多数情况下提供合理的性能并且仍旧在改进。由于它在可靠的 ext2文件系统之上添加了日志功能，因此可以将现有ext2文件系统转换为ext3文件系统，并且在必要时还可以转换回来。ext3 文件系统是一个成熟的文件系统，用作Redhat/Centos发行版上的默认文件系统。

3.ext4文件系统

Linux kernel 自 2.6.28 开始正式支持新的文件系统 Ext4。 Ext4 是 Ext3 的改进版，修改了 Ext3 中部分重要的数据结构，而不仅仅像 Ext3 对 Ext2 那样，只是增加了一个日志功能而已。Ext4 可以提供更佳的性能和可靠性，还有更为丰富的功能：

1）与 Ext3 兼容。执行若干条命令，就能从 Ext3 在线迁移到 Ext4，而无须重新格式化磁盘或重新安装系统。原有Ext3数据结构照样保留，Ext4 作用于新数据，当然，整个文件系统因此也就获得了Ext4所支持的更大容量。

2）更大的文件系统和更大的文件。较之Ext3目前所支持的更大16TB文件系统和更大2TB文件，Ext4 分别支持1EB（1,048,576TB， 1EB=1024PB， 1PB=1024TB）的文件系统，以及16TB的文件。

3）无限数量的子目录。 Ext3 目前只支持 32,000 个子目录，而 Ext4 支持无限数量的子目录。

4） Extents。 Ext3 采用间接块映射，当操作大文件时，效率低下。比如一个100MB 大小的文件，在 Ext3 中要建立 25,600 个数据块（每个数据块大小为4KB）的映射表。而 Ext4 引入了现代文件系统中流行的extents概念，每个extent 为一组连续的数据块，上述文件则表示为“该文件数据保存在接下来的25,600个数据块中”，提高了不少效率。

5）多块分配。当写入数据到Ext3文件系统中时，Ext3的数据块分配器每次只能分配一个 4KB的块，写一个100MB 文件就要调用25,600次数据块分配器，而Ext4的多块分配器“multiblock allocator”（mballoc）支持一次调用分配多个数据块。

6）延迟分配。 Ext3的数据块分配策略是尽快分配，而Ext4和其它现代文件操作系统的策略是尽可能地延迟分配，直到文件在cache中写完才开始分配数据块并写入磁盘，这样就能优化整个文件的数据块分配，与前两种特性搭配起来可以显著提升性能。

7）快速fsck。以前执行fsck之一步就会很慢，因为它要检查所有的inode，现在Ext4给每个组的inode表中都添加了一份未使用inode的列表，今后fsck Ext4 文件系统就可以跳过它们而只去检查那些在用的inode了。

8）日志校验。日志是最常用的部分，也极易导致磁盘硬件故障，而从损坏的日志中恢复数据会导致更多的数据损坏。Ext4 的日志校验功能可以很方便地判断日志数据是否损坏，而且它将Ext3的两阶段日志机制合并成一个阶段，在增加安全性的同时提高了性能。

9） “无日志”（No Journaling）模式。日志总归有一些开销，Ext4允许关闭日志，以便某些有特殊需求的用户可以借此提升性能。

10）在线碎片整理。尽管延迟分配、多块分配和extents能有效减少文件系统碎片，但碎片还是不可避免会产生。Ext4支持在线碎片整理，并将提供e4defrag工具进行个别文件或整个文件系统的碎片整理。

inode相关特性。 Ext4支持更大的inode，较之Ext3 默认的inode 大小 128 字节，Ext4 为了在inode中容纳更多的扩展属性（如纳秒时间戳或inode版本），默认inode大小为256字节。Ext4 还支持快速扩展属性（fast extended attributes）和inode保留（inodes reservation）。

12）持久预分配（Persistent preallocation）。 P2P 软件为了保证下载文件有足够的空间存放，常常会预先创建一个与所下载文件大小相同的空文件，以免未来的数小时或数天之内磁盘空间不足导致下载失败。 Ext4在文件系统层面实现了持久预分配并提供相应的API（libc 中的 posix_fallocate()），比应用软件自己实现更有效率。

13）默认启用barrier。磁盘上配有内部缓存，以便重新调整批量数据的写操作顺序，优化写入性能，因此文件系统必须在日志数据写入磁盘之后才能写commit记录，若commit记录写入在先，而日志有可能损坏，那么就会影响数据完整性。Ext4 默认启用barrier，只有当barrier之前的数据全部写入磁盘，才能写barrier之后的数据。（可通过 “mount -o barrier=0” 命令禁用该特性。）

4.ReiserFS 文件系统

ReiserFS是一个基于B状树的文件系统，拥有非常好的总体性能，特别是对于大量小文件。ReiserFS 拥有良好的伸缩性并具有日志功能。但该文件系统不再受到积极开发，不支持SELinux，基本上已被 Reiser4 取代。ReiserFS文件系统多年来一直用作一些发行版（包括SUSE）的默认文件系统，但现在用得少了。

5.XFS文件系统

XFS文件系统拥有日志功能，包含一些健壮的特性，并针对可伸缩性进行了优化。XFS在RAM中强制缓存中转数据，因此如果使用 XFS，建议采用不间断电源供应。淘宝的数据库在使用此文件系统。

XFS 最初是由 Silicon Graphics，Inc. 于90年代初开发的。那时，SGI发现他们的现有文件系统（existing filesystem，EFS）正在迅速变得不适应当时激烈的计算竞争。为解决这个问题，SGI 决定设计一种全新的高性能64位文件系统，而不是试图调整EFS在先天设计上的某些缺陷。因此，XFS 诞生了，并于 1994 年随 IRIX 5.3 的发布而应用于计算。它至今仍作为 SGI 基于 IRIX 的产品（从工作站到超级计算机）的底层文件系统来使用。现在，XFS 也可以用于 Linux。XFS的Linux 版的到来是激动人心的，首先因为它为 Linux 社区提供了一种健壮的、优秀的以及功能丰富的文件系统，并且这种文件系统所具有的可伸缩性能够满足最苛刻的存储需求。

6.vfat 文件系统

vfat 文件系统（也称为 FAT32）没有日志功能，且缺乏完整的 Linux 文件系统实现所需的许多特性。它可用于在 Windows 和 Linux 系统之间交换数据，因为 Windows 和 Linux 都能读取它。不要将这个文件系统用于 Linux，除非要在 Windows 和 Linux 之间共享数据。如果您在一个 vfat 磁盘上解压缩一个 Linux 归档文件，那么您将丢失权限（比如执行权限），还会丢失该归档文件中可能存储的符号链接。

7.VFS虚拟文件系统

虚拟文件系统VFS也称为虚拟文件系统开关(Virtual filesystem Switch)，它是内核的一个子系统，提供了一个通用文件系统模型，该模型囊括了所能见到的文件系统常用功能和行为，并为应用程序提供一致性的文件系统接口，安装的所有物理文件系统不但依赖于VFS共存，而且也依靠VFS协同工作。它的主要设计思想有以下3点：

(1)应用层：VFS模型源于UNIX文件系统，使得用户可以直接使用标准UNIX文件系统调用来操作文件，无需考虑具体文件系统特性和物理存储介质，通过VFS访问文件系统，才使得不同文件系统之间的协作性和通用性成为可能。

(2)虚拟层：在对所有具体文件系统的共同特性进行抽象的基础上，形成一个与具体文件系统实现无关的虚拟层，并在此层次上定义与用户的一致性接口；

(3)实现层：该层使用类似开关表技术进行具体文件系统转接，实现各种文件系统的物理操作细节，每个文件系统是自包含的，包含文件系统实现的各种设施，如超级块、节点区、数据区以及各种数据结构和文件类的操作函数。

一般地说，VFS提供以下功能：

•记录可用的文件系统类型；

•把文件系统与对应的存储设备联系起来；

•处理面向文件的通用操作；

•涉及具体文件系统的操作时，把它们映射到相关的具体文件系统。

VFS抽象层之所以能衔接各种不同的文件系统，是因为它定义了所有文件系统都支持的基本抽象接口和数据结构，同时具体的文件系统也将自己的诸如“文件如何打开”、“目录如何定义”等概念在形式上与VFS的定义保持一致。对于像FAT和NTFS这类非UNIX风格文件系统，必须经过封装，提供符合VFS概念的接口。比如，一个文件系统不支持inode概念，它也必须在内存中装配inode结构体，就像它本身包含inode一样。这些装配和转换需要在使用现场引入特别处理，使得非UNIX文件系统能够兼容UNIX文件系统的使用规则和满足VFS的需求，这样一来，非UNIX文件系统便可与VFS一道工作，只是性能上会有少许影响。

下面看一个文件操作的例子，假如应用程序执行如下文件操作：write(fd,&buf,len)；要求将buf指针指向的、长度为len字节的数据写入文件描述符fd对应的文件的当前位置。

用户执行的系统调用首先被VFS的sys_write( )处理，该函数首先处理一些与设备无关的操作，并找到f所在的文件系统，再根据VFS结构及它的inode数据结构提供的信息，重定向到具体文件系统中相对应的写函数，由它来处理与特定设备相关的操作，并把数据写到物理介质。

程序员必备知识（操作系统5-文件系统）

本篇与之前的第三篇的内存管理知识点有相似的地方

对于运行的进程来说，内存就像一个纸箱子, 仅仅是一个暂存数据的地方，而且空间有限。如果我们想要进程结束之后，数据依然能够保存下来，就不能只保存在内存里，而是应该保存在外部存储中。就像图书馆这种地方，不仅空间大,而且能够永久保存。

我们最常用的外部存储就是硬盘，数据是以文件的形式保存在硬盘上的。为了管理这些文件，我们在规划文件系统的时候，需要考虑到以下几点。

之一点,文件系统要有严格的组织形式，使得文件能够以块为单位进行存储。这就像图书馆里，我们会给设置一排排书架，然后再把书架分成一个个小格子，有的项目存放的资料非常多，一个格子放不下，就需要多个格子来进行存放。我们把这个区域称为存放原始资料的仓库区。

第二点,文件系统中也要有索引区，用来方便查找一个文件分成的多个块都存放在了什么位置。这就好比，图书馆的书太多了,为了方便查找,我们需要专门设置一排书架,这里面会写清楚整个档案库有哪些资料,资料在哪个架子的哪个格子上。这样找资料的时候就不用跑遍整个档案库,在这个书架上找到后，直奔目标书架就可以了。

第三点,如果文件系统中有的文件是热点文件,近期经常被读取和写入，文件系统应该有缓存层。这就相当于图书馆里面的热门图书区,这里面的书都是畅销书或者是常常被借还的图书。因为借还的次数比较多,那就没必要每次有人还了之后，还放回遥远的货架，我们可以专门开辟一个区域, 放置这些借还频次高此明的图书。这样借还的效率就会提高。

第四点,文件应该用文件夹的形式组织起来，方便管理和查询。这就像在图书馆里面，你可以给这些资料分门别类,比如分成计算机类.文学类.历史类等等。这样你也容易管理，项目组借阅的时候只要在某个类别中去找就可以了。

在文件系统中，每个文件都有友扒敬一个名字,这样我们访问一个文件，希望通过它的名字就可以找到。文件名就是一个普通的文本。当然文件名会经常冲突,不同用户取相同的名字的情况还是会经常出现的。

要想把很多的文件有序地组织起来,我们就需要把它们成为目录或者文件夹。这样,一个文件夹里可以包含文件夹,也可以包含文件,这样就形成了一种树形结构。而我们可以将不同的用户放在不同的用户目录下，就可以一定程度上避免了命名的冲突问题。

第五点，Linux 内核要在自己的内存里面维护一套数据结构，来保存哪些文件被哪些进程打开和使用。这就好比，图书馆里会有个图书管理系统，记录哪些书被借阅了，被谁借阅了，借阅了多久,什么时候归还。

文件系统是操作系统中负责管理持久数据的子系统，说简单点,就是负责把用户的文件存到磁盘硬件中,因为即使计算机断电了，磁盘里的数据并不会丢失,所以可以持久化的保存文件。

文件系统的基本数据单位是文件，它的目的是对磁盘上的文件进行组织管理，那组织的方式不同,就会形成不同的文件系统。

Linux最经典的一句话是:“一切皆文件”,不仅普通的文件和目录，就连块设备、管道、socket 等，也都是统一交给文件系统管理的。

Linux文件系统会为每个文件分配两个数据结构: 索引节点(index node) 和目录项(directory entry) ，它们主要用来记录文件的元信息和目录层次结构。

●索引节点，也就是inode, 用来记录文件的元信息，比如inode编号、文件大小访问权限、创建时间、修改时间、数据在磁盘的位置等等。索引节点是文件的唯一标识 ,它们之间一一对应, 也同样都会被存储在硬盘中,所以索引节点同样占用磁盘空间。好慎

●目录项，也就是dentry, 用来记录文件的名字、索引节点指针以及与其他目录项的层级关联关系。多个目录项关联起来，就会形成目录结构，但它与索引节点不同的是,目录项是由内核维护的一个数据结构,不存放于磁盘，而是缓存在内存。

由于索引节点唯一标识一个文件，而目录项记录着文件的名，所以目录项和索引节点的关系是多对一,也就是说，一个文件可以有多个别字。比如，硬链接的实现就是多个目录项中的索引节点指向同一个文件。

注意，目录也是文件，也是用索引节点唯一标识，和普通文件不同的是，普通文件在磁盘里面保存的是文件数据，而目录文件在磁盘里面保存子目录或文件。

（PS：目录项和目录不是一个东西！你也不是一个东西（^_=），虽然名字很相近，但目录是个文件。持久化存储在磁盘,而目录项是内核一个数据结构,缓存在内存。

如果查询目录频繁从磁盘读，效率会很低，所以内核会把已经读过的目录用目录项这个数据结构缓存在内存，下次再次读到相同的目录时，只需从内存读就可以,大大提高了文件系统的效率。

目录项这个数据结构不只是表示目录，也是可以表示文件的。）

磁盘读写的最小单位是扇区，扇区的大小只有512B大小，很明显，如果每次读写都以这么小为单位，那这读写的效率会非常低。

所以，文件系统把多个扇区组成了一个逻辑块，每次读写的最小单位就是逻辑块(数据块) , Linux中的逻辑块大小为4KB,也就是一次性读写 8个扇区,这将大大提高了磁盘的读写的效率。

以上就是索引节点、目录项以及文件数据的关系，下面这个图就很好的展示了它们之间的关系:

索引节点是存储在硬盘上的数据，那么为了加速文件的访问，通常会把索引节点加载到内存中。

另外，磁盘进行格式化的时候，会被分成三个存储区域，分别是超级块、索引节点区和数据块区。

●超级块,用来存储文件系统的详细信息，比如块个数、块大小、空闲块等等。

●索引节点区,用来存储索引节点;

●数据块区，用来存储文件或目录数据;

我们不可能把超级块和索引节点区全部加载到内存,这样内存肯定撑不住，所以只有当需要使用的时候，才将其加载进内存，它们加载进内存的时机是不同的.

●超级块:当文件系统挂载时进入内存;

●索引节点区:当文件被访问时进入内存;

文件系统的种类众多，而操作系统希望对用户提供一个统一的接口，于是在用户层与文件系统层引入了中间层，这个中间层就称为虚拟文件系统(Virtual File System, VFS) 。

VFS定义了一组所有文件系统都支持的数据结构和标准接口,这样程序员不需要了解文件系统的工作原理，只需要了解VFS提供的统一接口即可。

在Linux文件系统中，用户空间、系统调用、虚拟机文件系统、缓存、文件系统以及存储之间的关系如下图:

Linux支持的文件系统也不少，根据存储位置的不同，可以把文件系统分为三类:

●磁盘的文件系统，它是直接把数据存储在磁盘中,比如Ext 2/3/4. XFS 等都是这类文件系统。

●内存的文件系统，这类文件系统的数据不是存储在硬盘的,而是占用内存空间，我们经常用到的/proc 和/sys文件系统都属于这一类,读写这类文件,实际上是读写内核中相关的数据。

●网络的文件系统,用来访问其他计算机主机数据的文件系统，比如NFS. B等等。

文件系统首先要先挂载到某个目录才可以正常使用，比如Linux系统在启动时,会把文件系统挂载到根目录。

在操作系统的辅助之下，磁盘中的数据在计算机中都会呈现为易读的形式，并且我们不需要关心数据到底是如何存放在磁盘中,存放在磁盘的哪个地方等等问题，这些全部都是由操作系统完成的。

那么，文件数据在磁盘中究竟是怎么样的呢?我们来一探究竟!

磁盘中的存储单元会被划分为一个个的“ 块 ”，也被称为扇区 ,扇区的大小一般都为512byte.这说明即使一块数据不足512byte,那么它也要占用512byte的磁盘空间。

而几乎所有的文件系统都会把文件分割成固定大小的块来存储，通常一个块的大小为4K。如果磁盘中的扇区为512byte,而文件系统的块大小为4K,那么文件系统的存储单元就为8个扇区。这也是前面提到的一个问题，文件大小和占用空间之间有什么区别?文件大小是文件实际的大小，而占用空间则是因为即使它的实际大小没有达到那么大,但是这部分空间实际也被占用，其他文件数据无法使用这部分的空间。所以我们写入1byte的数据到文本中,但是它占用的空间也会是4K。

这里要注意在Windows下的NTFS文件系统中，如果一开始文件数据小于 1K,那么则不会分配磁盘块来存储，而是存在一个文件表中。但是一旦文件数据大于1K,那么不管以后文件的大小，都会分配以4K为单位的磁盘空间来存储。

与内存管理一样,为了方便对磁盘的管理,文件的逻辑地址也被分为一个个的文件块。于是文件的逻辑地址就是(逻辑块号，块内地址)。用户通过逻辑地址来操作文件,操作系统负责完成逻辑地址与物理地址的映射。

不同的文件系统为文件分配磁盘空间会有不同的方式，这些方式各自都有优缺点。

连续分配要求每个文件在磁盘上有一组连续的块，该分配方式较为简单。

通过上图可以看到，文件的逻辑块号的顺序是与物理块号相同的,这样就可以实现随机存取了，只要知道了之一个逻辑块的物理地址, 那么就可以快速访问到其他逻辑块的物理地址。那么操作系统如何完成逻辑块与物理块之间的映射呢?实际上,文件都是存放在目录下的，而目录是一种有结构文件, 所以在文件目录的记录中会存放目录下所有文件的信息，每一个文件或者目录都是一个记录。而这些信息就包括文件的起始块号和占有块号的数量。

那么操作系统如何完成逻辑块与物理块之间的映射呢? (逻辑块号, 块内地址) -> (物理块号, 块内地址)，只需要知道逻辑块号对应的物理块号即可,块内地址不变。

用户访问一个文件的内容,操作系统通过文件的标识符找到目录项FCB, 物理块号=起始块号+逻辑块号。当然，还需要检查逻辑块号是否合法,是否超过长度等。因为可以根据逻辑块号直接算出物理块号，所以连续分配支持顺序访问和随机访问。

因为读/写文件是需要移动磁头的，如果访问两个相隔很远的磁盘块,移动磁头的时间就会变长。使用连续分配来作为文件的分配方式，会使文件的磁盘块相邻，所以文件的读/写速度最快。

连续空间存放的方式虽然读写效率高，但是有磁盘空间碎片和文件长度不易扩展的缺陷。

如下图，如果文件B被删除，磁盘上就留下一块空缺，这时，如果新来的文件小于其中的一个空缺，我们就可以将其放在相应空缺里。但如果该文件的大小大于所

有的空缺，但却小于空缺大小之和，则虽然磁盘上有足够的空缺，但该文件还是不能存放。当然了，我们可以通过将现有文件进行挪动来腾出空间以容纳新的文件,但是这个在磁盘挪动文件是非常耗时，所以这种方式不太现实。

另外一个缺陷是文件长度扩展不方便，例如上图中的文件A要想扩大一下，需要更多的磁盘空间,唯一的办法就只能是挪动的方式，前面也说了，这种方式效率是非常低的。

那么有没有更好的方式来解决上面的问题呢?答案当然有，既然连续空间存放的方式不太行，那么我们就改变存放的方式，使用非连续空间存放方式来解决这些缺陷。

非连续空间存放方式分为链表方式和索引方式。

链式分配采取离散分配的方式，可以为文件分配离散的磁盘块。它有两种分配方式:显示链接和隐式链接。

隐式链接是只目录项中只会记录文件所占磁盘块中的之一块的地址和最后一块磁盘块的地址, 然后通过在每一个磁盘块中存放一个指向下一磁盘块的指针，从而可以根据指针找到下一块磁盘块。如果需要分配新的磁盘块,则使用最后一块磁盘块中的指针指向新的磁盘块,然后修改新的磁盘块为最后的磁盘块。

我们来思考一个问题, 采用隐式链接如何将实现逻辑块号转换为物理块号呢?

用户给出需要访问的逻辑块号i,操作系统需要找到所需访问文件的目录项FCB.从目录项中可以知道文件的起始块号，然后将逻辑块号0的数据读入内存,由此知道1号逻辑块的物理块号，然后再读入1号逻辑块的数据进内存，此次类推，最终可以找到用户所需访问的逻辑块号i。访问逻辑块号i,总共需要i+ 1次磁盘1/0操作。

得出结论: 隐式链接分配只能顺序访问，不支持随机访问，查找效率低。

我们来思考另外一个问题，采用隐式链接是否方便文件拓展?

我们知道目录项中存有结束块号的物理地址，所以我们如果要拓展文件，只需要将新分配的磁盘块挂载到结束块号的后面即可，修改结束块号的指针指向新分配的磁盘块，然后修改目录项。

得出结论: 隐式链接分配很方便文件拓展。所有空闲磁盘块都可以被利用到，无碎片问题，存储利用率高。

显示链接是把用于链接各个物理块的指针显式地存放在一张表中，该表称为文件分配表(FAT, File Allocation Table)。

由于查找记录的过程是在内存中进行的,因而不仅显著地提高了检索速度，而且大大减少了访问磁盘的次数。但也正是整个表都存放在内存中的关系，它的主要的缺点是不适用于大磁盘。

比如，对于200GB的磁盘和1KB大小的块，这张表需要有2亿项，每一项对应于这2亿个磁盘块中的一个块,每项如果需要4个字节，那这张表要占用800MB内存,很显然FAT方案对于大磁盘而言不太合适。

一直都在，加油！（*゜Д゜）σ凸←自爆按钮

链表的方式解决了连续分配的磁盘碎片和文件动态打展的问题，但是不能有效支持直接访问(FAT除外) ,索引的方式可以解决这个问题。

索引的实现是为每个文件创建一个索引数据块，里面存放的是指向文件数据块的指针列表 ,说白了就像书的目录一样,要找哪个章节的内容,看目录查就可以。

另外，文件头需要包含指向索引数据块的指针 ,这样就可以通过文件头知道索引数据块的位置，再通过索弓|数据块里的索引信息找到对应的数据块。

创建文件时，索引块的所有指针都设为空。当首次写入第i块时，先从空闲空间中取得一个块，再将其地址写到索引块的第i个条目。

索引的方式优点在于:

●文件的创建、增大、缩小很方便;

●不会有碎片的问题;

●支持顺序读写和随机读写;

由于索引数据也是存放在磁盘块的，如果文件很小，明明只需一块就可以存放的下，但还是需要额外分配一块来存放索引数据，所以缺陷之一就是存储索引带来的开销。

如果文件很大，大到一个索引数据块放不下索引信息，这时又要如何处理大文件的存放呢?我们可以通过组合的方式，来处理大文件的存储。

先来看看链表+索引的组合，这种组合称为链式索引块，它的实现方式是在索引数据块留出一个存放下一个索引数据块的指针，于是当一个索引数据块的索引信息用完了，就可以通过指针的方式，找到下一个索引数据块的信息。那这种方式也会出现前面提到的链表方式的问题，万一某个指针损坏了，后面的数据也就会无法读取了。

还有另外一种组合方式是索引+索引的方式，这种组合称为多级索引块，实现方式是通过一个索引块来存放多个索引数据块,一层套一层索引，像极了俄罗斯套娃是吧๑乛◡乛๑

前面说到的文件的存储是针对已经被占用的数据块组织和管理，接下来的问题是，如果我要保存一个数据块, 我应该放在硬盘上的哪个位置呢?难道需要将所有的块扫描一遍，找个空的地方随便放吗?

那这种方式效率就太低了，所以针对磁盘的空闲空间也是要引入管理的机制，接下来介绍几种常见的方法:

●空闲表法

●空闲链表法

●位图法

空闲表法

空闲表法就是为所有空闲空间建立一张表，表内容包括空闲区的之一个块号和该空闲区的块个数，注意，这个方式是连续分配的。如下图:

当请求分配磁盘空间时，系统依次扫描空闲表里的内容，直到找到一个合适的空闲区域为止。当用户撤销一个文件时，系统回收文件空间。这时，也需顺序扫描空闲表,寻找一个空闲表条目并将释放空间的之一个物理块号及它占用的块数填到这个条目中。

这种方法仅当有少量的空闲区时才有较好的效果。因为，如果存储空间中有着大量的小的空闲区,则空闲表变得很大,这样查询效率会很低。另外，这种分配技术适用于建立连续文件。

空闲链表法

我们也可以使用链表的方式来管理空闲空间，每一个空闲块里有一个指针指向下一个空闲块，这样也能很方便的找到空闲块并管理起来。如下图：

当创建文件需要一块或几块时，就从链头上依次取下一块或几块。反之，当回收空间时，把这些空闲块依次接到链头上。

这种技术只要在主存中保存一个指针, 令它指向之一个空闲块。其特点是简单,但不能随机访问，工作效率低，因为每当在链上增加或移动空闲块时需要做很多1/0操作,同时数据块的指针消耗了一定的存储空间。

空闲表法和空闲链表法都不适合用于大型文件系统，因为这会使空闲表或空闲链表太大。

位图法

位图是利用二进制的一位来表示磁盘中一个盘块的使用情况，磁盘上所有的盘块都有一个二进制位与之对应。

当值为0时，表示对应的盘块空闲，值为1时，表示对应的盘块已分配。它形式如下:

在Linux文件系统就采用了位图的方式来管理空闲空间,不仅用于数据空闲块的管理,还用于inode空闲块的管理，因为inode也是存储在磁盘的，自然也要有对其管理。

前面提到Linux是用位图的方式管理空闲空间，用户在创建一个新文件时， Linux 内核会通过inode的位图找到空闲可用的inode,并进行分配。要存储数据时，会通过块的位图找到空闲的块，并分配，但仔细计算一下还是有问题的。

数据块的位图是放在磁盘块里的，假设是放在一个块里,一个块4K,每位表示一个数据块,共可以表示4 * 1024 * 8 = 2^15个空闲块,由于1个数据块是4K大小，那么更大可以表示的空间为2^15 * 4 * 1024 = 2^27个byte,也就是128M。

也就是说按照上面的结构，如果采用（一个块的位图+ 一系列的块），外加一（个块的inode的位图+一系列的inode）的结构能表示的更大空间也就128M,

这太少了，现在很多文件都比这个大。

在Linux文件系统，把这个结构称为一个块组，那么有N多的块组,就能够表示N大的文件。

最终,整个文件系统格式就是下面这个样子。

最前面的之一个块是引导块,在系统启动时用于启用引导，接着后面就是一个一个连续的块组了,块组的内容如下:

● 超级块 ,包含的是文件系统的重要信息，比如inode总个数、块总个数、每个块组的inode个数、每个块组的块个数等等。

● 块组描述符 ,包含文件系统中各个块组的状态,比如块组中空闲块和inode的数目等，每个块组都包含了文件系统中「所有块组的组描述符信息」。

● 数据位图和inode位图，用于表示对应的数据块或inode是空闲的，还是被使用中。

● inode 列表，包含了块组中所有的inode, inode 用于保存文件系统中与各个文件和目录相关的所有元数据。

● 数据块，包含文件的有用数据。

你可以会发现每个块组里有很多重复的信息，比如超级块和块组描述符表，这两个都是全局信息，而且非常的重要，这么做是有两个原因:

●如果系统崩溃破坏了超级块或块组描述符,有关文件系统结构和内容的所有信息都会丢失。如果有冗余的副本,该信息是可能恢复的。

●通过使文件和管理数据尽可能接近，减少了磁头寻道和旋转,这可以提高文件系统的性能。

不过，Ext2 的后续版本采用了稀疏技术。该做法是，超级块和块组描述符表不再存储到文件系统的每个块组中,而是只写入到块组0、块组1和其他ID可以表示为3、5、7的幂的块组中。

在前面，我们知道了一个普通文件是如何存储的，但还有一个特殊的文件,经常用到的目录，它是如何保存的呢?

基于Linux 一切切皆文件的设计思想，目录其实也是个文件,你甚至可以通过vim打开它，它也有inode, inode 里面也是指向一些块。

和普通文件不同的是，普通文件的块里面保存的是文件数据，而目录文件的块里面保存的是目录里面一项一项的文件信息。

在目录文件的块中，最简单的保存格式就是列表，就是一项一项地将目录下的文件信息(如文件名、文件inode.文件类型等)列在表里。

列表中每一项就代表该目录下的文件的文件名和对应的inode,通过这个inode,就可以找到真正的文件。

通常，之一项是「则」，表示当前目录,第二项是.，表示上一级目录, 接下来就是一项一项的文件名和inode。

如果一个目录有超级多的文件,我们要想在这个目录下找文件,按照列表一项一项的找,效率就不高了。

于是，保存目录的格式改成哈希表，对文件名进行哈希计算,把哈希值保存起来,如果我们要查找一个目录下面的文件名，可以通过名称取哈希。如果哈希能够匹配上,就说明这个文件的信息在相应的块里面。

Linux系统的ext文件系统就是采用了哈希表，来保存目录的内容,这种方法的优点是查找非常迅速，插入和删除也较简单,不过需要一些预备措施来避免哈希冲突。

目录查询是通过在磁盘上反复搜索完成，需要不断地进行/0操作,开销较大。所以,为了减少/0操作,把当前使用的文件目录缓存在内存，以后要使用该文件时只要在内存中操作，从而降低了磁盘操作次数,提高了文件系统的访问速度。

感谢您的阅读，希望您能摄取到知识！加油！冲冲冲！（发现光，追随光，成为光，散发光！）我是程序员耶耶！有缘再见。

关于linux文件系统实验原理的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

数据运维技术 » 深入了解Linux文件系统实验原理 (linux文件系统实验原理)

分享到：

Linux文件系统特点？

程序员必备知识（操作系统5-文件系统）

相关推荐