linux core dump 配置和用法

原文鏈接:https://www.jianshu.com/p/dc7e7bd7d1a2

本文轉載自:https://www.jianshu.com/p/dc7e7bd7d1a2
作者:heyzqq

1 core 說明

Core文件其實就是內存的映像,當程序崩潰時,存儲內存的相應信息,主用用於對程序進行調試。
關於Core產生的原因很多,比如過去一些Unix的版本不支持現代Linux上這種GDB直接附着到進程上進行調試的機制,需要先向進程發送終止信號,然後用工具閱讀core文件。在Linux上,我們就可以使用kill向一個指定的進程發送信號或者使用gcore命令來使其主動出Core並退出。如果從淺層次的原因上來講,出Core意味着當前進程存在BUG,需要程序員修復。從深層次的原因上講,是當前進程觸犯了某些OS層級的保護機制,逼迫OS向當前進程發送諸如SIGSEGV(即signal 11)之類的信號, 例如訪問空指針或數組越界出Core,實際上是觸犯了OS的內存管理,訪問了非當前進程的內存空間,OS需要通過出Core來進行警示,這就好像一個人身體內存在病毒,免疫系統就會通過發熱來警示,並導致人體發燒是一個道理(有意思的是,並不是每次數組越界都會出Core,這和OS的內存管理中虛擬頁面分配大小和邊界有關,即使不出Core,也很有可能讀到髒數據,引起後續程序行爲紊亂,這是一種很難追查的BUG)。

2 core dump 啓動

我們可以直接在 ulimit -c 後面加上參數,當爲數字時表示限制 core 文件大小不超過 1024KB[ulimit -c 1024]:

2.1 查看當前限制大小

輸入命令 ulimit -c 查看狀態, 0 說明是禁止生成 core 文件。

[root@ ~]# ulimit -c
0

2.2 設置啓動和大小配置

直接在 ulimit -c 後面加上參數,當爲數字時表示限制 core 文件大小不超過 1024KB[ulimit -c 1024]:
unlimited: 字面意思,沒有限制 core 文件大小。

[root@ ~]# ulimit -c unlimited

3 設置 core 文件的存儲目錄和命名格式

設置 core 的存儲目錄和命名格式,主要是修改配置文件 /proc/sys/kernel/core_pattern

3.1 設置當前目錄

設置程序運行目錄生成core 文件, core-程序名-程序pid-時間 [core-test-1234-1916257740]

[root@ ~]# echo "core-%e-%p-%t" > /proc/sys/kernel/core_pattern

3.2 指定路徑

把所有的 core 集中到一個文件夾裏 ,例如c ore文件放到 /tmp/ 目錄下]

[root@ ~]# echo "/tmp/core-%e-%p-%t" > /proc/sys/kernel/core_pattern

4 core dump 使用

4.1 編寫測試代碼

測試代碼爲連續釋放2次,會產生錯誤

// FILE:test.c
#include<stdlib.h>

void repeatFree(char *p)
{
    if(NULL != p)
    {
        free(p);
    }
}

int main()
{
    char* pstr =(char*) malloc(10);

    repeatFree(pstr); // 第一次釋放

    repeatFree(pstr); // 第二次釋放

    return 0;
}

4.2 編譯

gcc 編譯,加 -g 參數,方便調試時候可以定位問題。

gcc -g test.c -o test

4.3 運行調試

[root@ ~]# gcc -g test.c -o test
# 運行
[root@ ~]# ./test 
*** Error in `./test': double free or corruption (top): 0x0000000001078010 ***
======= Backtrace: =========
/lib/x86_64-linux-gnu/libc.so.6(+0x777e5)[0x7f753c2e47e5]
/lib/x86_64-linux-gnu/libc.so.6(+0x8037a)[0x7f753c2ed37a]
/lib/x86_64-linux-gnu/libc.so.6(cfree+0x4c)[0x7f753c2f153c]
./test[0x400585]
./test[0x4005b6]
/lib/x86_64-linux-gnu/libc.so.6(__libc_start_main+0xf0)[0x7f753c28d830]
./test[0x400499]
.....

4.4 定位問題

[root@ ~]# gdb test core-test-19317-1516269504
[New LWP 19317]
.......一些基本信息.......
Core was generated by `./test'.
Program terminated with signal SIGABRT, Aborted.
.......一些錯誤信息.......
(gdb) where
#0  0x00007f753c2a2428 in __GI_raise (sig=sig@entry=6) at ../sysdeps/unix/sysv/linux/raise.c:54
#1  0x00007f753c2a402a in __GI_abort () at abort.c:89
#2  0x00007f753c2e47ea in __libc_message (do_abort=do_abort@entry=2, 
    fmt=fmt@entry=0x7f753c3fde98 "*** Error in `%s': %s: 0x%s ***\n") at ../sysdeps/posix/libc_fatal.c:175
#3  0x00007f753c2ed37a in malloc_printerr (ar_ptr=<optimized out>, ptr=<optimized out>, 
    str=0x7f753c3fdf88 "double free or corruption (top)", action=3) at malloc.c:5006
#4  _int_free (av=<optimized out>, p=<optimized out>, have_lock=0) at malloc.c:3867
#5  0x00007f753c2f153c in __GI___libc_free (mem=<optimized out>) at malloc.c:2968
#6  0x0000000000400585 in repeatFree (p=0x1078010 "") at test.c:8
#7  0x00000000004005b6 in main () at test.c:18
(gdb)

在 gdb 內,輸入 where 可以看出, 我們寫的程序出錯的兩行:

#6  0x0000000000400585 in repeatFree (p=0x1078010 "") at test.c:8
#7  0x00000000004005b6 in main () at test.c:18

在 repeatFree 函數中,test.c 文件的第 8 行,也就是下面這行錯啦,釋放了兩次內存

free(p);
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章