Linux系统 2023-06-26

关于Linux Coredump的原理和应用解析 (linux coredump)

Linux Coredump是Linux操作系统中的一个非常重要的特性，它为我们在调试程序时提供了非常有用的工具。本文将从原理和应用两个方面来解析Linux Coredump。

一、Coredump的原理

Coredump是一种操作系统级别的机制，它允许程序在运行过程中遇到错误时，将当前进程中的所有信息，包括程序代码、运行状态、内存空间、线程调用栈等，打印到一个特殊的文件中，从而方便我们在后续的调试中进行分析和定位问题。

具体来说，Coredump的原理可以概括为以下几个步骤：

1.程序出现问题，操作系统接收到异常信号

2.操作系统通知程序执行Coredump操作

3.程序将当前进程信息写入指定文件中

4.操作系统回调程序继续运行

在Linux中，Coredump通常由操作系统内核实现，具体而言，是由内核模块”crash_dump”和”sysctl_writers”控制的。当程序出现需要生成Coredump文件的异常信号时，内核模块crash_dump就会将进程的关键信息存储到内存中，并通过sysctl_writers模块，将这些信息写入指定位置的文件中。

二、Coredump的应用

Coredump作为一个非常重要的工具，主要用于程序开发和调试中。在真实的生产环境中，程序可能会面临各种不同的挑战，比如内存泄露、死锁、文件读写异常等等，这些问题可能会导致程序崩溃或者无法正常运行。此时，Coredump就可以发挥重要作用。

Coredump可以提供程序崩溃时的详细信息，帮助开发者分析程序运行状态，发现问题并及时解决。具体而言，Coredump可以提供以下方面的信息：

1.程序在出现异常之前的代码执行情况

2.程序崩溃时的堆栈调用信息

3.程序中涉及到的内存地址和存储空间

4.程序打开的文件信息和网络连接信息等等

基于这些信息，开发者可以很容易地找到程序的问题所在，并进行针对性的优化和修复。

除了调试外，Coredump还可以用于安全或者法律方面的审计。对于一些需要高度安全的系统，如果涉及到黑客攻击等非正常事件，Coredump可以记录事件发生时的系统状态，以供后续的事件调查和分析。同时，Coredump也可以遵循相关规定，形成法律证据以供司法机关使用。

三、Coredump的注意事项

虽然Coredump是非常有用的工具，但是在使用时也需要注意一些问题。具体而言，需要注意以下几点：

1. Coredump可能会泄漏敏感信息：Coredump会记录当前进程的全部状态，包括内存信息、文件信息等。如果进程中涉及到敏感信息，比如密码、证书等等，都可能被记录和泄漏，因此需要特别注意。

2. Coredump耗费时间和资源：由于Coredump需要遍历整个进程空间，并将相关信息写入文件中，因此会对系统资源造成一定的消耗，包括CPU、内存等等。如果Coredump频繁触发，可能会对系统性能带来负面影响。

3. Coredump需要适当限制大小：由于Coredump会记录全部信息，因此生成的文件可能会非常大，特别是在一些内存占用比较大的应用程序中。如果不加限制，可能会导致系统崩溃或者磁盘空间被耗尽，因此需要设置适当的限制。

四、

Coredump作为Linux系统中的一个非常重要的特性，为我们在程序开发和调试中提供了非常有用的工具。通过了解Coredump的原理和应用，我们可以更好地理解它的作用和使用方法，进而为程序开发和运维工作提供更好的支持。需要注意的是，在使用Coredump时需要谨慎，以避免出现不必要的问题。

相关问题拓展阅读：

如何使用GDB调试Coredump文件

一般这种情况都是因为数组越界访问，空指针或是野指针读写造成的。程序小的话还比较好办，对着源代码仔细检查就能解决。但是对于代码量较大的程序，里边包含N多函数调用，N多数组指针访问，这时想定位问题就不是很容易了（此时牛人依然可以通过在适当位置打printf加二分查找的方式迅速定位:P）。懒人的颤晌含话还是直接GDB搞起吧。神马是Core Dump文件偶尔就能听见某程序员同学抱怨“擦，又出Core了！”。简单来说，core dump说的是操作系统执行的一个动作，当某个进程因为一些原因意外终止（crash）的时候，操作系统会将这个进程当时的内存信息转储（dump）到磁盘上1。产生的文件就是core文件了，一般会以core.形式命名。如何产生Core Dump 发生doredump一般都是在进程收到某个信号的时候，Linux上谨中现在大概有60多个信号，可以使用 kill -l 命令全部列出来。sagi@sagi-laptop:~$ kill -l 1) SIGHUP 2) SIGINT 3) SIGQUIT 4) SIGILL 5) SIGTRAP 6) SIGABRT 7) SIGBUS 8) SIGFPE 9) SIGKILL 10) SIGUSR1 11) SIGSEGV 12) SIGUSR2 13) SIGPIPE 14) SIGALRM 15) SIGTERM 16) SIGSTKFLT 17) SIGCHLD 18) SIGCONT 19) SIGSTOP 20) SIGTSTP 21) SIGTTIN 22) SIGTTOU 23) SIGURG 24) SIGXCPU 25) SIGXFSZ 26) SIGVTALRM 27) SIGPROF 28) SIGWINCH 29) SIGIO 30) SIGPWR 31) SIGSYS 34) SIGRTMIN 35) SIGRTMIN+1 36) SIGRTMIN+2 37) SIGRTMIN+3 38) SIGRTMIN+4 39) SIGRTMIN+5 40) SIGRTMIN+6 41) SIGRTMIN+7 42) SIGRTMIN+8 43) SIGRTMIN+9 44) SIGRTMIN+10 45) SIGRTMIN+11 46) SIGRTMIN+12 47) SIGRTMIN+13 48) SIGRTMIN+14 49) SIGRTMIN+15 50) SIGRTMAX-14 51) SIGRTMAX-13 52) SIGRTMAX-12 53) SIGRTMAX-11 54) SIGRTMAX-10 55) SIGRTMAX-9 56) SIGRTMAX-8 57) SIGRTMAX-7 58) SIGRTMAX-6 59) SIGRTMAX-5 60) SIGRTMAX-4 61) SIGRTMAX-3 62) SIGRTMAX-2 63) SIGRTMAX-1 64) SIGRTMAX针对特定的信号，应用程序可以写对应的信号处理函数。如果不指定，则采取默认的处理方式, 默认处理是coredump的信号如下：3)SIGQUIT 4)SIGILL 6)SIGABRT 8)SIGFPE 11)SIGSEGV 7)SIGBUS 31)SIGSYS 5)SIGTRAP 24)SIGXCPU 25)SIGXFSZ 29)SIGIOT 我们看到SIGSEGV在其中，一般数组越界或是访问空指针都会产生这个信号。另外虽然默认是这样的，但是你也可以写自己的信号处理函数改变默认行为，更多信号相关可以看参考茄笑链接33。上述内容只是产生coredump的必要条件，而非充分条件。要产生core文件还依赖于程序运行的shell，可以通过ulimit -a命令查看，输出内容大致如下：sagi@sagi-laptop:~$ ulimit -a core file size (blocks, -c) 0 data seg size (kbytes, -d) unlimited scheng priority (-e) 20 file size (blocks, -f) unlimited pending signals (-i)max locked memory (kbytes, -l) 64 max memory size (kbytes, -m) unlimited open files (-n) 1024 pipe size (512 bytes, -p) 8 POSIX message queues (bytes, -q)real-time priority (-r) 0 stack size (kbytes, -s) 8192 cpu time (seconds, -t) unlimited max user processes (-u) unlimited virtual memory (kbytes, -v) unlimited file locks (-x) unlimited 看到之一行了吧，core file size，这个值用来限制产生的core文件大小，超过这个值就不会保存了。我这里输出是0，也就是不会保存core文件，即使产生了，也保存不下来==! 要改变这个设置，可以使用ulimit -c unlimited。 OK, 现在万事具备，只缺一个能产生Core的程序了，介个对C程序员来说太容易了。#include ; #include ; int crash() { char * = “crash!!”; = ‘D’; // 写只读存储区! return 2; } int foo() { return crash(); } int main() { return foo(); } 上手调试上边的程序编译的时候有一点需要注意，需要带上参数-g, 这样生成的可执行程序中会带上足够的调试信息。编译运行之后你就应该能看见期待已久的“Segment Fault(core dumped)”或是“段错误 (核心已转储)”之类的字眼了。看看当前目录下是不是有个core或是core.的文件。祭出linux下经典的调试器GDB，首先带着core文件载入程序：gdb exefile core，这里需要注意的这个core文件必须是exefile产生的，否则符号表会对不上。载入之后大概是这个样子的：sagi@sagi-laptop:~$ gdb coredump core Core was generated by ./coredump’. Program terminated with signal 11, Segmentation fault. #0 0x080483a7 in crash () at coredump.c:8 8 = ‘D’; (gdb)我们看到已经能直接定位到出core的地方了，在第8行写了一个只读的内存区域导致触发Segment Fault信号。在载入core的时候有个小技巧，如果你事先不知道这个core文件是由哪个程序产生的，你可以先随便找个代替一下，比如/usr/bin/w就是不错的选择。比如我们采用这种方法载入上边产生的core，gdb会有类似的输出：sagi@sagi-laptop:~$ gdb /usr/bin/w core Core was generated by ./coredump’. Program terminated with signal 11, Segmentation fault. #0 0x080483a7 in ? () (gdb)可以看到GDB已经提示你了，这个core是由哪个程序产生的。 GDB 常用操作上边的程序比较简单，不需要另外的操作就能直接找到问题所在。现实却不是这样的，常常需要进行单步跟踪，设置断点之类的操作才能顺利定位问题。下边列出了GDB一些常用的操作。启动程序：run设置断点：b 行号|函数名删除断点：delete 断点编号禁用断点：disable 断点编号启用断点：enable 断点编号单步跟踪：next 也可以简写 n单步跟踪：step 也可以简写 s打印变量：print 变量名字设置变量：set var=value查看变量类型：ptype var顺序执行到结束：cont顺序执行到某一行： util lineno打印堆栈信息：bt

linux服务器端崩溃，有core文件信息，崩溃前我的最后一句代码是vector::clear()

这种错误，你有代码和coredump，都找不到问题了，别人怎么搞。

应该是内存相关的问题，对象已经释放了之类的。

你在gdb ， frame 1 ， frame 6等等，跳到对应的调用栈上去。检查TCards ， vector这种对象的指针是不是还是有效的？

到底什么原因导致的这个core dump。你空橘岁这个应该是游戏代码，用户离开的时候触发的这个bug。全部相伍迟关的逻辑代斗睁码都要检查一下吧，看看是不是哪里导致某个类的对象被销毁了多次之类的。

linux coredump的介绍就聊到这里吧，感谢你花时间阅读本站内容，更多关于linux coredump,关于Linux Coredump的原理和应用解析,如何使用GDB调试Coredump文件,linux服务器端崩溃，有core文件信息，崩溃前我的最后一句代码是vector::clear()的信息别忘了在本站进行查找喔。

数据运维技术 » 关于Linux Coredump的原理和应用解析 (linux coredump)

分享到：

如何使用GDB调试Coredump文件

linux服务器端崩溃，有core文件信息，崩溃前我的最后一句代码是vector::clear()

相关推荐