Linux系统 2023-07-16

深入探究Linux内核线程堆栈：原理分析与优化方法 (linux内核线程堆栈)

Linux内核是现代操作系统中常用的一种，它的核心是内核。Linux内核本身是由C语言编写的，它实现了操作系统中最基本的功能，例如进程管理、内存管理和文件系统等。对于Linux内核而言，线程是一个非常重要的概念，线程堆栈作为线程的重要组成部分，其实现和优化对Linux内核的性能和稳定性都有很大的影响。因此，本文就深入探究Linux内核线程堆栈的原理和优化方法。

一、线程堆栈的概念和作用

线程是引入到操作系统中的一种新的程序执行实体，它可以独立执行，与其他线程并发执行。线程堆栈是线程的重要组成部分，它是线程运行时保存本地变量、参数和返回地址信息的存储区域。线程的每次函数调用都需要在堆栈上分配一定大小的空间，将函数的参数、函数局部变量和函数返回地址等信息存储到堆栈中。当函数返回时，栈中存储的数据将被弹出，栈指针也会恢复到原来的位置。因此，线程堆栈实际上记录了线程的执行过程。线程堆栈在Linux内核中的作用包括：

1. 存储线程的本地变量、参数和返回地址等信息。

2. 记录线程执行函数的调用关系，保证函数的正确返回。

3. 存储异常处理信息，保证线程的异常处理能力。

二、Linux内核线程堆栈的实现原理

Linux内核线程堆栈的具体实现机制依赖于Linux内核版本和CPU架构。本文围绕x86-64架构和4.10.0版本的Linux内核展开。在Linux内核中，线程堆栈是通过页表机制实现的。页表是将线性地址映射到物理地址的数据结构，是内核和硬件协同工作的重要元素，它负责将虚拟地址映射到物理地址，使得系统可以快速访问内存。Linux内核线程堆栈的实现流程可以概括为以下3个步骤：

1. 分配栈内存

当线程被创建时，内核需要为该线程分配栈内存。在x86-64中，内核将栈空间划分为多个页，每个页大小为4KB。内核将连续的若干页映射到一个虚拟地址空间上，这个虚拟地址称为线程的栈顶地址（stack pointer）。内核通过调用kmalloc函数从内核内存池中分配相应大小的内存空间，以完成对栈内存的分配。

2. 记录栈指针

分配完栈内存之后，内核需要跟踪线程的栈指针（stack pointer）。栈指针是指向栈顶的指针，用于标记当前线程栈空间的使用情况。因为栈空间是一个先进后出（FILO）的内存结构，内核需要始终保持该栈指针在栈空间内部。因此，每次线程调用函数时，内核将该函数的参数、返回地址等信息存储到堆栈中，并更新栈指针的位置，使其指向下一个可用位置。

3. 处理异常情况

线程堆栈不仅仅是一个逻辑上的概念，实际上它还承担着异常处理的功能。当线程执行出错时，则需要更新栈指针的位置，并将出错的现场信息存储到栈上，以准确记录出错情况。如果出现栈溢出现象，则需要内核的异常处理机制介入，以防止系统的严重崩溃和数据损坏。

三、线程堆栈的性能优化方法

1. 使用大页

在Linux内核中，大页是指4KB以上的物理页面大小，它可以有效地减少页表的数量。这样在访问内存时可以更快地转换虚拟地址到物理地址，从而提高系统的性能。因此，使用大页可以优化线程堆栈的页表操作，实现更高效的内存访问。

2. 意识缓存层次结构

现代CPU都有多级缓存，缓存能够提高内存访问效率。在线程堆栈中，缓存层次结构对于性能也有重要的影响。因此，对于对线程堆栈数据的访问，需要注意缓存层次结构，利用缓存机制来提高访问效率。例如，可以使用局部性原理，将经常访问的数据存储在缓存中，减少底层内存运算；或在多线程应用程序中，使用线程本地存储技术来避免线程之间的竞争。

3. 避免过多的内存分配

每次在线程堆栈中访问函数参数时，内核都需要分配一段新的内存空间。如果这个过程过于频繁，在内存管理上会产生一定的开销。因此，为了避免过多的内存分配，可以尽量减少函数参数的数量，将参数打包传递；或通过静态分配存储空间，避免重复分配。

四、

线程堆栈是Linux内核中的重要概念，其实现机制和优化方法对系统的性能和稳定性有着至关重要的影响。本文就Linux内核线程堆栈的原理和优化方法进行了深入探究。值得注意的是，不同版本的内核对于线程堆栈的实现和优化方法也有所不同，需要根据具体情况进行调整。未来我们应持续关注Linux内核的发展，从中发掘更多革新性的设计和实践。

相关问题拓展阅读：

请教linux下用户态进程调度问题

请教linux下用户态进程调度问题

在进行Linux系统操作的时候，有时候会遇到一次用户态进程死循环，即系统反应迟钝、进程挂死等问题，那么遇到这些问题又该如何解决呢？下面小编就给大家介绍下一次用户态进程死循环的问题该如何处瞎颤理。

Linux下如何处理一次用户态进程死循环问题

　　1、问题现象

　　业务进程（用户态多线程程序）挂死，操作系统反应迟钝，系统日志没有任何异常。从进程的内核态堆栈看，看似所有线程都卡在了内核态的如下堆栈流程中：

　　［root@vmc116 ~］# cat /proc/27007/task/11825/stack

　　［《ffffffff8100baf6》］ retint_careful+0x14/0x32

　　［《ffffffffffffffff》］ 0xffffffffffffffff

　　2、喊兄问题分析

　　1）内核堆栈分析

　　从内核堆栈看，所有进程都阻塞在 retint_careful上，这个是中断返回过程中的流程，代码（汇编）如下：

　　entry_64.S

　　代码如下：

　　ret_from_intr：

　　DISABLE_INTERRUPTS（CLBR_NONE）

　　TRACE_IRQS_OFF

　　decl PER_CPU_VAR（irq_count）

　　/* Restore saved previous stack */

　　popq %rsi

　　CFI_DEF_CFA rsi，SS+8-RBP /* reg/off reset after def_cfa_expr */

　　leaq ARGOFFSET-RBP（%rsi）， %rsp

　　CFI_DEF_CFA_REGISTER rsp

　　CFI_ADJUST_CFA_OFFSET RBP-ARGOFFSET

　　。。。

　　retint_careful：

　　CFI_RESTORE_STATE

　　bt $TIF_NEED_RESCHED，%edx

　　jnc retint_signal

　　TRACE_IRQS_ON

　　ENABLE_INTERRUPTS（CLBR_NONE）

　　pushq_cfi %rdi

　磨渗败　SCHEDULE_USER

　　popq_cfi %rdi

　　GET_THREAD_INFO（%rcx）

　　DISABLE_INTERRUPTS（CLBR_NONE）

　　TRACE_IRQS_OFF

　　jmp retint_check

　　这其实是用户态进程在用户态被中断打断后，从中断返回的流程，结合retint_careful+0x14/0x32，进行反汇编，可以确认阻塞的点其实就在

　　SCHEDULE_USER

　　这其实就是调用schedule（）进行调度，也就是说当进程走到中断返回的流程中时，发现需要调度（设置了TIF_NEED_RESCHED），于是在这里发生了调度。

　　有一个疑问：为什么在堆栈中看不到schedule（）这一级的栈帧呢？

　　因为这里是汇编直接调用的，没有进行相关栈帧压栈和上下文保存操作。

　　2）进行状态信息分析

　　从top命令结果看，相关线程实际一直处于R状态，CPU几乎完全耗尽，而且绝大部分都消耗在用户态：

　　［root@vmc116 ~］# top

　　top – 09:42:23 up 16 days， 2:21， 23 users， load average： 84.08， 84.30， 83.62

　　Tasks： 1037 total， 85 running， 952 sleeping， 0 stopped， 0 zombie

　　Cpu（s）： 97.6%us， 2.2%sy， 0.2%ni， 0.0%id， 0.0%wa， 0.0%hi， 0.0%si， 0.0%st

　　Mem：k total，k used，k free，k buffers

　　Swap：k total， 38644k used，k free，k cached

　　PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

rootm 163m 14m R 10.2 0.5 321:06.17 z_itask_templat

rootm 163m 14m R 10.2 0.5 296:23.37 z_itask_templat

rootm 163m 14m R 10.2 0.5 337:57.26 z_itask_templat

rootm 163m 14m R 10.2 0.5 327:31.93 z_itask_templat

rootm 163m 14m R 10.2 0.5 306:49.44 z_itask_templat

rootm 163m 14m R 10.2 0.5 310:47.41 z_itask_templat

rootm 163m 14m R 10.2 0.5 283:03.37 z_itask_templat

rootm 163m 14m R 10.2 0.5 283:49.67 z_itask_templat

rootm 163m 14m R 10.2 0.5 261:24.46 z_itask_templat

rootm 163m 14m R 10.2 0.5 150:24.53 z_itask_templat

rootm 163m 14m R 10.2 0.5 100:26.77 z_itask_templat

rootm 163m 14m R 9.9 0.5 337:18.77 z_itask_templat

rootm 163m 14m R 9.9 0.5 314:24.17 z_itask_templat

rootm 163m 14m R 9.9 0.5 336:32.78 z_itask_templat

rootm 163m 14m R 9.9 0.5 338:55.08 z_itask_templat

rootm 163m 14m R 9.9 0.5 306:46.08 z_itask_templat

rootm 163m 14m R 9.9 0.5 316:49.51 z_itask_templat

　　。。。

　　3）进程调度信息

　　从相关线程的调度信息看：

　　［root@vmc116 ~］# cat /proc/27007/task/11825/schedstat

　　发现相关线程的调度统计一直在增加，说明相关线程一直是在被调度运行的，结合其状态也一直是R，推测很可能在用户态发生了死循环（或者非睡眠死锁）。

　　这里又有问题：为什么从top看每个线程的CPU占用率只有10%左右，而不是通常看到的死循环进程导致的100%的占用率？

　　因为线程数很多，而且优先级都一样，根据CFS调度算法，会平均分配时间片，不会让其中一个线程独占CPU。结果为多个线程间轮流调度，消耗掉了所有的cpu。。

　　另一个问题：为什么这种情况下，内核没有检测到softlockup？

　　因为业务进程的优先级不高，不会影响watchdog内核线程（更高优先级的实时线程）的调度，所以不会产生softlockup的情况。

　　再一个问题：为什么每次查看线程堆栈时，总是阻塞在retint_careful，而不是其它地方？

　　因为这里（中断返回的时候）正是调度的时机点，在其它时间点不能发生调度（不考虑其它情况~），而我们查看线程堆栈的行为，也必须依赖于进程调度，所以我们每次查看堆栈时，正是查看堆栈的进程（cat命令）得到调度的时候，这时正是中断返回的时候，所以正好看到的阻塞点为retint_careful。

　　4）用户态分析

　　从上面的分析看，推测应该是用户态发生了死锁。

　　用户态确认方法：

　　部署debug信息，然后gdb attach相关进程，确认堆栈，并结合代码逻辑分析。

　　最终确认该问题确为用户态进程中产生了死循环。

关于linux内核线程堆栈的介绍到此就结束了，不知道你从中找到你需要的信息了吗？如果你还想了解更多这方面的信息，记得收藏关注本站。

数据运维技术 » 深入探究Linux内核线程堆栈：原理分析与优化方法 (linux内核线程堆栈)

分享到：

请教linux下用户态进程调度问题

相关推荐