Linux系统 2023-08-02

Linux下如何优化磁盘读取次数？ (linux 读磁盘的次数)

在Linux系统中，磁盘读取次数的优化是一个重要的方面。优化磁盘读取次数不仅可以提高磁盘IO性能，还可以减少磁盘的损耗和延长其使用寿命。本文将介绍Linux下如何优化磁盘读取次数。

1.使用SSD

SSD是目前更流行的高速磁盘，相比传统的机械磁盘具有更高的读写速度、更快的响应时间和更少的电力消耗。如果你的系统规模允许，建议使用SSD代替传统机械磁盘，这样可以大幅度提高系统整体的性能水平。

2.使用软件RD

RD（redundant array of independent disks）技术是指由多个硬盘组成的阵列，它通过将数据分割并写入到多个硬盘上，从而提高数据的冗余性和可靠性。但是，传统的硬件RD方案需要高昂的成本，而使用软件RD方案则可以在不增加成本的情况下提高数据的冗余性和系统性能。

在Linux系统中，软件RD可以通过mdadm命令进行设置和管理。mdadm命令提供了RD 0、1、4、5、6等多种磁盘阵列类型，用户可以根据自己的需求进行选择。

3.使用LVM

LVM（Logical Volume Manager）是一种逻辑卷管理器，可以将多个物理卷集成成一个逻辑卷，并通过LVM管理器进行统一管理，从而提高磁盘的管理效率。LVM还可以实现数据的在线扩容、迁移等功能，在不停机的情况下进行磁盘管理。

在Linux系统中，使用LVM可以有效地减少磁盘的读取次数。通过将多个物理卷集成成一个逻辑卷，LVM可以将数据分散存储在多个物理硬盘上，从而减少磁盘读取次数。

4.使用RAM disk

RAM disk是一种虚拟磁盘，它将内存的一部分作为硬盘使用，可以快速存取和读取数据，提高系统的响应速度和性能。在Linux系统中，用户可以使用tmpfs命令在内存中创建一个RAM disk，并将数据暂时存储在RAM disk中进行处理，从而避免频繁的磁盘读写操作。

5.使用缓存技术

缓存技术是指将常用的数据存储在内存中，从而减少磁盘读取次数。在Linux系统中，用户可以使用缓存技术来提高文件系统的访问速度。

其中，最常用的缓存技术包括：Buffer Cache和Page Cache。Buffer Cache是指将文件数据缓存到内存中，将系统的读写操作限制在缓存中的数据范围内。Page Cache是指将文件的逻辑块缓存到内存中，将读写操作局限在逻辑块的范围内。

磁盘读取次数的优化对于Linux系统的性能提升和磁盘寿命的延长都有着重要的意义。用户可以通过使用SSD、软件RD、LVM、RAM disk、缓存技术等手段来提高磁盘读取次数，从而实现系统性能的优化和延长磁盘使用寿命的目的。

相关问题拓展阅读：

linux下程序在运行过程中访问主存的总次数和缺页次数怎么求？
如何提高Linux服务器磁盘io性能

linux下程序在运行过程中访问主存的总次数和缺页次数怎么求？

不困谨知道你从哪里看到的一个缺页率的概念。

微软的文档只说page fault per second

。

SAP的文档

这里有个缺页率的说法？指的其实就是 Pages Input/sec 。

如果是这个话，linux你可以用ps 命令，top 命令， perf命令之类查看这几个值，然后算一下每秒个数吧。我在另外一个帖子已经回复你了。

—–

至于你这里说的主存的总次数，这个东西几本不可能统计的出来。你知道内存都是分为一个page 一page，比如说4k的大小。但程序内存访问肯定不是每次都是4k大小的。

cpu是有写内存访问相关的硬件计数信息，这个可以通过一些性能测试工具，可以算出cpu上的内存带宽。但这个其实和你那恶主存总访猜裤问次数关系不大，因为我看你这个是想用来计算所谓的“缺页率”的。内存访问其实很多时候都不是在一个page上面连续的。有可能地址是离散的，没法统计什么的主存访问计数。

另外cpu的cache有很多级，L1 cache ， L2 L3 cache扽。真正的到达主存的其实已经很少了，最求程序性能其实很多时候关注的是 L1 L2 这些级别缓存的命中率。这些都可以通过性能测试工具读取得到。

至于为什么有page fault可以有很准确的计数，是因为发生page fault的时候，硬件会通过中断通知系统内核。然后其实微软的文档说的 page input ， page output等都是说的swap交换内存到磁盘的磁盘操作。这个信息前面的汪兆基帖子我前面也给你列出来了。还有vmstat这些命令应该也是可以看到 swap分区的使用情况的。

这东西其实没必要那么死扣字眼，理解原理就可以了。想page fault这个，就知道为什么会影响性能，怎么判断page fault是不是对程序影响很大就行了。

看你老来提问，写了好多。。。。。。。

什么是页故障：页面故障是要访问的页面不在主存中，操作系统需要被转移到主存储器，然后访问。内存访问期间，在主内禅灶碧存中访问的页面，访问取得成功，如果所访问的页面是不是在主辩春内存中，然后失败的访问贺举，并生成一个页面页故障率：错。如果程序P的页面的总数为S的运行过程中被访问，并且其中产生页面错误中断访问次数为F，则页错误率：F / S。

如何提高Linux服务器磁盘io性能

您好，很高兴为您解答。

在现有文件系统下进行优化：

linux内核和各个文件系统采用了几个优化方案来提升磁盘访问速度。但这些优化方案需要在我们的服务器设计中进行配合才能得到充分发挥。

文件系统缓存

linux内核会将大部分空闲内存交给虚拟文件系统，来作为文件缓存，叫做page cache。在内存不足时，这部分内存会采用lru算法进行淘汰。通过free命令查看内存，显示为cached的部分就是文件缓存了。

如何针对性优化：

lru并不是一个优秀淘汰算法，lru更大的优势是普适性好，在各种使用场景下都能起到一定的效果。如果能找到当前使用场景下，文件被访问的统计特征，针对性的写一个淘汰算法，可以大幅提升文件缓存的命中率。对于http正向代理来说，一个好的淘汰算法可以用1GB内存达到lru算法100GB内存的缓存效果。如果不打算写一个新镇李的淘汰算法，一般不需要在应用层再搭一个文件cache程序来做缓存。

最小分配：

当文件扩大，需要分配磁盘空间时，大部分文件系统不会仅仅只分配当前需要的磁盘空间，而是会多分配一些磁盘空间。这样下次文件扩大时就可以使用已经分配好的空间，而不会频繁的去分配新空间。

例如ext3下，每次分配磁盘空间时，最小是分配8KB。

最小分配的副作用是会浪费一些磁盘空间（分配了但是又没有使用）

如何针对性优化：

我们在reiserfs下将最小分配空间从8KB改大到128K后提升了30%的磁盘io性能。如果当前使用场景下小文件很多，把预分配改大就会浪费很多磁盘空间，所以这个数值要根据当前使用场景来设定。似乎要直接改源代码才能生效，不太记得了，09年的时候改的，冲敏有兴趣的同学自己google吧。

io访问调度：

在同时有多个io访问时，linux内核可以对这些io访问按LBA进行合并和排序，这样磁头在移动时，可以“顺便”读出移动过程中的数据。

SATA等磁盘甚至在磁盘中内置了io排序来进一步提升性能，一般需要在主板中进行配置才能启动磁盘内置io排序。linux的io排序是根据LBA进行御判迟的，但LBA是一个一维线性地址，无法完全反应出二维的圆形磁盘，所以磁盘的内置io排序能达到更好的效果。

如何针对性优化：

io访问调度能大幅提升io性能，前提是应用层同时发起了足够的io访问供linux去调度。

怎样才能从应用层同时向内核发起多个io访问呢？

方案一是用aio_read异步发起多个文件读写请求。

方案二是使用磁盘线程池同时发起多个文件读写请求。

对我们的http正向代理来说，采用16个线程读写磁盘可以将性能提升到2.5倍左右。具体开多少个线程/进程，可以根据具体使用场景来决定。

小提示：

将文件句柄设置为非阻塞时，进程还是会睡眠等待磁盘io，非阻塞对于文件读写是不生效的。在正常情况下，读文件只会引入十几毫秒睡眠，所以不太明显；而在磁盘io极大时，读文件会引起十秒以上的进程睡眠。

预读取：

linux内核可以预测我们“将来的读请求”并提前将数据读取出来。通过预读取可以减少读io的次数，并且减小读请求的延时。

如何针对性优化：

预读取的预测准确率是有限的，与其依赖预读取，不如我们直接开一个较大的缓冲区，一次性将文件读出来再慢慢处理；尽量不要开一个较小的缓冲区，循环读文件/处理文件。

虽然说“预读取”和“延迟分配”能起到类似的作用，但是我们自己扩大读写缓冲区效果要更好。

延迟分配：

当文件扩大，需要分配磁盘空间时，可以不立即进行分配，而是暂存在内存中，将多次分配磁盘空间的请求聚合在一起后，再进行一次性分配。

延迟分配的目的也是减少分配次数，从而减少文件不连续。

延迟分配的副作用有几个：

1、如果应用程序每次写数据后都通过fsync等接口进行强制刷新，延迟分配将不起作用

2、延迟分配有可能间歇性引入一个较大的磁盘IO延时（因为要一次性向磁盘写入较多数据）

只有少数新文件系统支持这个特性

如何针对性优化：

如果不是对安全性（是否允许丢失）要求极高的数据，可以直接在应用程序里缓存起来，积累到一定大小再写入，效果比文件系统的延迟分配更好。如果对安全性要求极高，建议经常用fsync强制刷新。

在线磁盘碎片整理：

Ext4提供了一款碎片整理工具，叫e4defrag，主要包含三个功能：

1、让每个文件连续存储

2、尽量让每个目录下的文件连续存储

3、通过整理空闲磁盘空间，让接下来的分配更不容易产生碎片

如何针对性优化：

“让每个目录下的文件连续存储”是一个极有价值的功能。

传统的做法是通过拼接图片来将这10张图片合并到一张大图中，再由前端将大图切成10张小图。

有了e4defrag后，可以将需连续访问的文件放在同一个文件夹下，再定期使用e4defrag进行磁盘整理。

实现自己的文件系统：

在大部分服务器上，不需要支持“修改文件”这个功能。一旦文件创建好，就不能再做修改操作，只支持读取和删除。在这个前提下，我们可以消灭所有文件碎片，把磁盘io效率提升到理论极限。

有一个公式可以衡量磁盘io的效率：

磁盘利用率 = 传输时间/（平均寻道时间+传输时间）

如若满意，请点击回答右侧【采纳答案】，如若还有问题，请点击【追问】

~ O(∩_∩)O~

关于linux 读磁盘的次数的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

数据运维技术 » Linux下如何优化磁盘读取次数？ (linux 读磁盘的次数)

分享到：

linux下程序在运行过程中访问主存的总次数和缺页次数怎么求？

如何提高Linux服务器磁盘io性能

相关推荐