Linux内核如何创建页表 (linux 内核页表创建)

作为开源领域更受欢迎的操作系统之一,Linux内核已经成为众多IT从业者和开发者的首选选择。其中,页表是Linux内核中处理内存管理的核心部分之一。Linux内核中的页表可以根据虚拟地址获取对应的物理地址,这个过程中牵涉到分页、地址转换等操作。那么,本文将深入探讨,以及其中涉及的相关操作。

一、页表是什么?

在计算机中,内存被划分为很多固定大小的块,成为”页面”(Page)。每个页面的大小通常为4KB,也就是说,每个页面可以存储4*1024个字节的数据。计算机中的程序在运行时,需要加载到内存中才能执行。以C语言编写的程序,编译成可执行文件后,为了方便加载和管理,内存中的数据和代码会被分割成若干个固定大小的块,每个块就是一个页面。

页面不是独立存在的,而是需要组成一个页表。页表是一种数据结构,能够将虚拟地址映射成物理地址。虚拟地址是程序使用的地址,而物理地址是实际存储数据的地址。当程序需要访问内存中的数据时,Linux内核将根据虚拟地址检索页表,从而找到对应的物理地址。因此,页表是指内核中一种数据结构,其中存储了虚拟地址与物理地址的映射关系,方便程序在内存中读取和存储数据。

二、Linux内核中如何创建页表?

在Linux中,内核负责管理内存分配和释放,而创建页表就是其中必不可少的操作之一。下面将从分页机制、地址转换等角度,深入探讨。

(一)分页机制

Linux内核采用的是分页机制,将物理内存划分成固定大小的块,即页面,其大小为4KB。为了方便管理,由内核进行管理,其中包括将每个页面与一个页框对应起来。页框是物理内存中的一个固定大小的块,其大小与页面相同,有一个长度为32位的标识符。当程序需要从内存中读取数据时,Linux内核根据页面的大小将数据划分成多个页面,然后将这些页面映射到物理地址中去。这样就可以更好地利用物理内存。

(二)地址转换

Linux内核中创建页表还涉及到地址转换的操作。在Linux中,计算机分配给每个进程的虚拟地址空间是相同的,而不同进程之间的虚拟地址是不同的。进程在执行过程中,就是将自己的虚拟地址空间映射到物理地址空间中去。操作系统管理着一张全局的页表,每次进程发生虚拟地址转换时,都需要在这张页表中查找对应的物理地址映射。

地址转换的过程如下:

1、16位的段选择符,选择要使用的段描述符。

2、根据段描述符的内容找到段的基址(段基址+偏移量,最终形成一个32位的虚拟地址)。

3、将虚拟地址中的高10位(前22位)作为索引,找到页目录表中对应项的地址。

4、用虚拟地址中间10位(位于22到31的位置)作为索引,找到页表中对应的页表条目。

5、使用虚拟地址的最后12位(位于0到11)作为索引,找到页表条目的对应页面,将其物理地址返回。

(三)物理、逻辑地址空间划分

Linux中将物理内存分成3个区域,即内核空间、DMA空间以及进程地址空间。其中,内核空间中包含的内存划分给内核使用,DMA空间提供访问设备的内存地址,进程地址空间为用户进程提供的内存空间。物理内存区间的具体划分如下:

1、00000000 – 9fffffff:用户空间,内存地址从 0 开始。

2、a0000000 – bfffffff:内核 I/O 映射空间,预留了一段虚拟地址区域,对应物理地址的范围是 a0000000 到 bfffffff。这段区域的内存访问不通过 TLB。映射关系通过 ioremap 函数建立。ioremap_nocache 用于不能被 CPU cache 映射的区域。除了CPU之外,没有任何硬件会通过访问这个区域获取信息。

3、c0000000 – c03fffff:内核虚拟地址空间,即内核代码,全局变量等。从此处开始的区间是内核的虚拟地址空间,内核的代码、全局数据以及内核映射的一些设备内存等都位于这个地址空间内。由于内核可以访问物理内存,所以内核也可以从物理地址空间中查找和管理内存。简单下来,内核虚拟地址空间给内核使用,且内核和进程地址空间是隔离的。

(四)页表管理

页表是对程序虚拟地址和物理地址之间互相映射关系的描述,为了管理这些映射关系,Linux内核需要建立页目录表和页表。页目录表是一种存放页表条目指针的数据结构,页表条目包含了虚拟地址与物理地址之间的映射关系。

Linux中页目录表对应的数据结构为pgd_t,页表条目对应的数据结构为pte_t。Linux内核进行页表的创建是在初始化内存管理时完成的,在这个过程中,内核会创建一张全局的也到表,用于记录分配给每个进程的虚拟地址空间。同时,内核中还会维护一组 FREE_PAGE 内存池,用于申请和释放页面。申请页面的函数名是get_free_page,而释放页面的函数名是put_page。

三、

通过以上的介绍,我们可以了解到Linux内核中如何创建页表。内核采用了分页机制,在页面和页框之间进行映射,同时,页表也由页目录表和页表条目组成。当进程需要访问内存中的数据时,内核会在页表中查找虚拟地址对应的物理地址,根据映射关系获取对应数据。Linux内核管理内存,不仅能够更好地利用系统资源,同时也很好地保证了程序的安全性和稳定性。

相关问题拓展阅读:

嵌入式中linux内核在内存中运行地址0x到内存起始运行地址0x中的(0x8000=32k)怎么回事?

/* 创建核心页表 */

bl __create_page_tables

Linux进程内存如何管理?

Linux内存管理

摘要:本章首先以应用程序开发者的角度审视Linux的进程内存管理,在此基础上逐步深入到内核中讨论系统物理内存管理和内核内存的使用方法。力求从外到内、水到渠成地引导网友分析Linux的内存管理与使用。在本章最后,我们给出一个内存映射的实例,帮助网友们理解内核内存管理与用户内存管理之间的关系,希望大家最终能驾驭Linux内存管理。

前言

内存管理一向是所有操作系统书籍不惜笔墨重点讨论的内容,无论市面上或是网上都充斥着大量涉及内存管理的教材和资料。因此,我们这里所要写的Linux内存管理采取避重就轻的策略,从桥弊理论层面就不去班门弄斧,贻笑大方了。我们最想做的和可能做到的是从开发者的角度谈谈对内存管理的理解,最终目的是把我们在内核开发中使用内存的经验和对Linux内存管理的认识与大家共享。

当然,这其中我们也会涉及到一些诸如段页等内存管理的基本理论,但我们的目的不是为了强调理论,而是为了指导理解开发中的实践,橘消蚂所以仅仅点到为止,不做深究。

遵循“理论来源于实践”的“教条”,我们先不必一下子就钻入内核里去看系统内存到底是如何管理,那样往往会让你陷入似懂非懂的窘境(我当年就犯了这个错误!)。所以更好的方式是先从外部(用户编程范畴)来观察进程如何使用内存,等到大家对内存的使用有了较直观的认识后,再深入到内核中去学习内存如何被管理等理论知识。最后再通过一个实例编程将所讲内容融会贯通。

进程与内存

进程如何使用内存?

毫无疑问,所有进程(执行的程序)都必须占用一定数量的内存,它或是用来存放从磁盘载入的程序代码,或是存放取自用户输入的数据等等。不过进程对这些内存的管理方式因内存用途不一而不尽相同,有些内存是事先静态分配和统一回收的,而有些却是按需要动态分配和回收的。

对任何一个普通进程来讲,它都会涉及到5种不同的数据段。稍有编程知识的朋友都能想到这几个数据段中包含有“程序代码段”、“程序数据段”、“程序堆栈段”等。不错,这几种数据段都在其中,但除了以上几种数据段之外,进程还另外包含两种数据段。下面我们来简单归纳一下进程对应的内存空间中所包含的5种不同的数据区。

*代码段*:代码段是用来存放可执行文件的操作指令,也就是说是它是可执行程序在内存中的镜像。代码段需要防止在运行时被非法修改,所以只准许读取操作,而不允许写入(修改)操作——它是不可写的。

*数据段*:数据段用来存放可执行文件中已初始化圆埋全局变量,换句话说就是存放程序静态分配的变量和全局变量。

BSS*段***:BSS段包含了程序中未初始化的全局变量,在内存中 bss段全部置零。

堆(heap*)*:堆是用于存放进程运行中被动态分配的内存段,它的大小并不固定,可动态扩张或缩减。当进程调用malloc等函数分配内存时,新分配的内存就被动态添加到堆上(堆被扩张);当利用free等函数释放内存时,被释放的内存从堆中被剔除(堆被缩减)

*栈*:栈是用户存放程序临时创建的局部变量,也就是说我们函数括弧“{}”中定义的变量(但不包括static声明的变量,static意味着在数据段中存放变量)。除此以外,在函数被调用时,其参数也会被压入发起调用的进程栈中,并且待到调用结束后,函数的返回值也会被存放回栈中。由于栈的先进先出特点,所以栈特别方便用来保存/恢复调用现场。从这个意义上讲,我们可以把堆栈看成一个寄存、交换临时数据的内存区。

进程如何组织这些区域?

上述几种内存区域中数据段、BSS和堆通常是被连续存储的——内存位置上是连续的,而代码段和栈往往会被独立存放。有趣的是,堆和栈两个区域关系很“暧昧”,他们一个向下“长”(i386体系结构中栈向下、堆向上),一个向上“长”,相对而生。但你不必担心他们会碰头,因为他们之间间隔很大(到底大到多少,你可以从下面的例子程序计算一下),绝少有机会能碰到一起。

Linux系统提供了复杂的存储管理系统,使得进程所能访问的内存达到4GB。在Linux系统中,进程的4GB内存空滑物间被分为两个部分—颤让掘—用户空间与内核空间。用户空间的地址一般分布为0~3GB(即PAGE_OFFSET,在Ox86中它等于OxC),这样,剩下的3~4GB为内核空间,用户进程通常只能访问用户空间的虚拟地址,不能访问内核空间的虚拟地址。用户进程只有通过系统调用(代表用户进程在内核态执行)等方式才可以访问到内核空间。每个进程的用户空间都是完全独立、互不相干的,用户进程各自有不同的页表。而内核空间是由内核负责映射,它并不会跟着进程改变,是固定的。内核空间的虚拟地址到物理地址映射是被所有进程共享的,内核的虚拟空间独立于其他程序。Linux中1GB的内核地址空间又被划分为物理内存映射区、虚拟内存分配区、高端页面映射区、专用页面映射区和系统保留映射区这几个区域。对于x86系统而言,一般情况下,物理内存映射区更大长度为896MB,系统的物理内存被顺序映射在内核空间的这个区域中。当系统物理内存大于896MB时,超过物理内存映射区的那部分内存称为高端内存(而未超过物理内存映射区的内存通常被称为常规内存),内核在存取高端内存时必须将它们映射到高端页面映射区。Linux保留内核空间最顶部FIXADDR_TOP~4GB的区域作为保留区。当系统物理内存超过4GB时,必须使用CPU的扩展分页(PAE)模式所提供的64位页目录项才能存取到4GB以上的物理内存,这需要CPU的支持。加入了PAE功能的Intel Pentium Pro及以后的CPU允许内存更大可配置到64GB,它们茄核具备36位物理地址空间寻址能力。由此可见,对于32位的x86而言,在3~4GB之间的内核空间中,从低地址到高地址依次为:物理内存映射区隔离带vmalloc虚拟内存分配器区隔离带高端内存映射区专用页面映射区保留区。

这个不是1-2句仔液粗话就表达明白的。可以看下我写的相关书籍。

第9章 Linux进程管理命令 / 298

9.1ps:查看进程 / 298

9.2pstree:显示进程状态树 / 305

9.3pgrep:查找匹配条件的进程 / 306

9.4kill:终止进程 / 307

9.5killall:通过进程名终止进程 / 310

9.6pkill:通过进程名终止进程 / 311

9.7top:实时显示系统中各个进程的资源占用状况 / 313

9.8nice:调整程序运行时的优先级 / 320

9.9renice:调整运行中的进程的优先级 / 323

9.10nohup:用户退出系统进程埋带继续工作 / 324

9.11strace:跟踪进程的系统调用 / 325

9.12ltrace:跟踪进程调用库念镇函数 / 332

9.13runlevel:输出当前运行级别 / 334

9.14init:初始化Linux进程 / 335

关于linux 内核页表创建的介绍到此就结束了,不知道你从中找到你需要的信息了吗 ?如果你还想了解更多这方面的信息,记得收藏关注本站。


数据运维技术 » Linux内核如何创建页表 (linux 内核页表创建)