調試器GDB的基本使用方法

GDB調試的三種方式:

1. 目標板直接使用GDB進行調試。

2. 目標板使用gdbserver,主機使用xxx-linux-gdb作爲客戶端。

3. 目標板使用ulimit -c unlimited,生成core文件;然後主機使用xxx-linux-gdb ./test ./core。

 Brendan Gregg關於gdb介紹《gdb Debugging Full Example (Tutorial): ncurses》。

1. gdb調試

構造測試程序如下main.c和sum.c如下:

複製代碼

main.c:

#include <stdio.h>
#include <stdlib.h>
 
extern int sum(int value);
 
struct inout {
    int value;
    int result;
};

int main(int argc, char * argv[])
{
    struct inout * io = (struct inout * ) malloc(sizeof(struct inout));
    if (NULL == io) {
        printf("Malloc failed.\n");
        return -1;
    }

    if (argc != 2) {
        printf("Wrong para!\n");
        return -1;
    }

    io -> value = *argv[1] - '0';
    io -> result = sum(io -> value);
    printf("Your enter: %d, result:%d\n", io -> value, io -> result);
    return 0;
}

sum.c:

int sum(int value) {
    int result = 0;
    int i = 0;
    for (i = 0; i < value; i++)
        result += (i + 1);
    return result;
}

複製代碼

然後gcc main.c sum.c -o main -g, 得到main可執行文件.

下面介紹了gdb大部分功能,1.1 設置斷點以及 1.3顯示棧幀是常用功能;調試過程中可以需要1.6 單步執行,並且1.4 顯示變量、1.5顯示寄存器、1.8 監視點、1.9 改變變量的值。

如果進程已經運行中,需要1.11 attach到進程,或者1.10 生成轉儲文件進行分析。當然爲了提高效率可以自定義1.13 初始化文件。

1.1 設置斷點

設置斷點可以通過b或者break設置斷點,斷點的設置可以通過函數名、行號、文件名+函數名、文件名+行號以及偏移量、地址等進行設置。

格式爲:

break 函數名

break 行號

break 文件名:函數名

break 文件名:行號

break +偏移量

break -偏移量

break *地址

查看斷點,通過info break查看斷點列表。

刪除斷點通過命令包括:

delete <斷點id>:刪除指定斷點

delete:刪除所有斷點

clear

clear 函數名

clear 行號

clear 文件名:行號

clear 文件名:函數名

斷點還可以條件斷住

break 斷點 if 條件;比如break sum if value==9,當輸入的value爲9的時候纔會斷住。

condition 斷點編號:給指定斷點刪除觸發條件

condition 斷點編號 條件:給指定斷點添加觸發條件

如下可以看出,當入參爲9的時候被斷住,而入參爲8的時候運行到結束。

斷點還可以通過disable/enable臨時停用啓用。

disable

disable 斷點編號

disable display 顯示編號

disable mem 內存區域

 

enable

enable 斷點編號

enable once 斷點編號:該斷點只啓用一次,程序運行到該斷點並暫停後,該斷點即被禁用。

enable delete 斷點編號

enable display 顯示編號

enable mem 內存區域

1.1.1 斷點commands高級功能

大多數時候需要在斷點處執行一系列動作,gdb提供了在斷點處執行命令的高級功能commands。

複製代碼

#include <stdio.h>

int total = 0;

int square(int i)
{
    int result=0;

    result = i*i;

    return result;
}

int main(int argc, char **argv)
{
    int i;

    for(i=0; i<10; i++)
    {
        total += square(i);
    }
    return 0;
}

複製代碼

比如需要對如上程序square參數i爲5的時候斷點,並在此時打印棧、局部變量以及total的值

編寫gdb.init如下:

複製代碼

set logging on gdb.log


b square if i == 5
commands
  bt full
  i locals
  p total
  print "Hit break when i == 5"
end

複製代碼

在gdb shell中source gdb.init,然後r執行命令,結果如下:

可以看出斷點在i==5的時候斷住了,並且此時打印了正確的值。

1.2 運行

“gdb 命令”之後,run可以在gdb下運行命令;如果命令需要參數則跟在run之後。

如果需要斷點在main()處,直接執行start就可以。

1.3 顯示棧幀

如果遇到斷點而暫停執行,或者coredump可以顯示棧幀。

通過bt可以顯示棧幀,bt full可以顯示局部變量。

命令格式如下:

bt

bt full:不僅顯示backtrace,還顯示局部變量

bt N:顯示開頭N個棧幀

bt full N

1.4 顯示變量

“print 變量”可以顯示變量內容。

如果需要一行監控多個變量,可以通過p {var1, var2, var3}。

如果要跟蹤自動顯示,可以使用display {var1, var2, var3}

1.5 顯示寄存器

info reg可以顯示寄存器內容。

在寄存器名之前加$可以顯示寄存器內容,

p $寄存器:顯示寄存器內容

p/x $寄存器:十六進制顯示寄存器內容。

 

用x命令可以顯示內容內容,“x/格式 地址”。

x $pc:顯示程序指針內容

x/i $pc:顯示程序指針彙編。

x/10i $pc:顯示程序指針之後10條指令。

x/128wx 0xfc207000:從0xfc20700開始以16進制打印128個word。

還可以通過disassemble指令來反彙編。

disassemble

disassemble 程序計數器 :反彙編pc所在函數的整個函數。

disassemble addr-0x40,addr+0x40:反彙編addr前後0x40大小。

1.6 單步執行

單步執行有兩個命令next和step,兩者的區別是next遇到函數不會進入函數內部,step會執行到函數內部。

如果需要逐條彙編指令執行,可以分別使用nexti和stepi。

1.7 繼續執行

 調試時,使用continue命令繼續執行程序。程序遇到斷電後再次暫停執行;如果沒有斷點,就會一直執行到結束。

continue:繼續執行

continue 次數:繼續執行一定次數。

1.8 監視點

要想找到變量在何處被改變,可以使用watch命令設置監視點watchpoint。

watch <表達式>:表達式發生變化時暫停運行

awatch <表達式>:表達式被訪問、改變是暫停執行

rwatch <表達式>:表達式被訪問時暫停執行

其他變種還包括watch expr [thread thread-id] [mask maskvalue],其中mask需要架構支持。

GDB不能監控一個常量,比如watch 0x600850報錯。

但是可以watch *(int *)0x600850。

1.9 改變變量的值

“通過set variable <變量>=<表達式>”來修改變量的值。

 set $r0=xxx:設置r0寄存器的值爲xxx。

1.10 生成內核轉儲文件

通過“generate-core-file”生成core.xxxx轉儲文件。

然後gdb ./main ./core.xxxx查看恢復的現場。

另一命令gcore可以從命令行直接生成內核轉儲文件。

gcore `pidof 命令`:無需停止正在執行的程序已獲得轉儲文件。

1.11 attach到進程 

如果程序已經運行,或者是調試陷入死循環而無法返回控制檯進程,可以使用attach命令。

attach pid

通過ps aux可以查看進程的pid,然後使用bt查看棧幀。

以top爲例操作步驟爲:

1. ps -aux查看進程pid,爲16974.

2. sudo gdb attach 16974,使用gdb 附着到top命令。

3. 使用bt full查看,當前棧幀。此時使用print等查看信息。

4. 還可以通過info proc查看進程信息。

1.12 反覆執行

continue、step、stepi、next、nexti都可以指定重複執行的次數。

ignore 斷點編號 次數:可以忽略指定次數斷點。

1.13 初始化文件

Linux環境下初始化文件爲.gdbinit。

如果存在.gdbinit文件,gdb在啓動的之前就將其作爲命令文件運行。

初始化文件和命令文件執行順序爲:HOME/.gdbinit > 運行命令行選項 > ./.gdbinit > -x指定命令文件。

1.14 設置源碼目錄

調試過程中如果需要關聯到源碼,查看更詳細的信息。

可以通過directory或者set substitute-path來制定源碼目錄。

1.15 TUI調試

TUI(TextUser Interface)爲GDB調試的文本用戶界面,可以方便地顯示源代碼、彙編和寄存器文本窗口。

源代碼窗口和彙編窗口會高亮顯示程序運行位置並以'>'符號標記。有兩個特殊標記用於標識斷點,第一個標記用於標識斷點類型:

B:程序至少有一次運行到了該斷點

b:程序沒有運行到過該斷點

H:程序至少有一次運行到了該硬件斷點

h:程序沒有運行到過該硬件斷點 

第二個標記用於標識斷點使能與否:

+:斷點使能Breakpointis enabled. -:斷點被禁用Breakpointis disabled. 

當調試程序時,源代碼窗口、彙編窗口和寄存器窗口的內容會自動更新。

1.16 Catchpoint

catch可以根據某些類型事件來停止程序執行。

可以通過catch syscall close,捕捉產生系統調用close的時候停止程序執行。

其他的catch事件還包括,throw、syscall、assert、exception等等。

1.17 自定義腳本

命令行的入參可以通過argc和*argv獲取。

1.17.0 註釋、賦值、顯示

# - 爲腳本添加註釋。

set - 爲變量賦值,以$開頭,以便區分gdb還是調試程序變量。

例如:set $x = 1

顯示變量可以通過echo、printf。

1.17.1自定義命令

利用define命令可以自行定義命令,還可以使用document命令給自定義命令添加說明。

複製代碼

define adder
  if $argc == 2
    print $arg0 + $arg1
  end
  if $argc == 3
    print $arg0 + $arg1 + $arg2
  end
end

document adder
  Sum two or three variables.
end

複製代碼

執行bf自定義命令,結果如下。

 

無行參聲明,但可以直接用$arg0,$arg1引用, $argc 爲形參個數

1.17.2 條件語句

條件命令:if...else...end。這個同其它語言中提供的if命令沒什麼區別,只是注意結尾的end

1.17.3 循環語句

循環命令:while...end。gdb同樣提供了loop_breakloop_continue命令分別對應其它語言中的breakcontinue,另外同樣注意結尾的end

複製代碼

set logging on overwrite gdb.log------------將顯示log保存到gdb.log中。
set pagination off--------------------------關閉分頁顯示功能。

tar jtag jtag://localhost:1025--------------連接上JTAG。

d-------------------------------------------刪除現有斷點。

b func_a------------------------------------在func_a增加斷點。
commands------------------------------------斷點後,執行如下命令。
  b func_b----------------------------------在func_a斷點之後,在func_b增加斷點。
    commands
      bt full-------------------------------打印func_b處棧幀。
      c-------------------------------------繼續執行。
    end
  b file.c:555------------------------------在file.c的555行增加斷點
    commands
      while 1-------------------------------無限執行next命令。
        next
      end
    end
  c-----------------------------------------繼續執行,纔會觸發func_b和file.c:555斷點。
end

c-------------------------------------------是程序得到繼續執行。

複製代碼

在命令行gdb -x gdb.init bin;或者gdb bin,然後在命令行soruce gdb.init同樣可以更新腳本。

1.18 dump內存到指定文件

在gdb調試中可能需要將一段內存導出到文件中,可以藉助dump命令。

命令格式:

dump binary memory FILE START STOP

比如dump binary memory ./dump.bin 0x0 0x008000000,將內存區間從0x0到0x00800000導出到dump.bin中。

2. gdb+gdbserver遠程調試

目標板gdbserver+主機gdb遠程調試的方式,比較適合目標板性能受限,只能提供gdbserver功能。

在主機上執行gdb進行遠程調試。測試程序如下。

複製代碼

#include <stdio.h>

void C(int *p)
{
    *p = 0x12;
}

void B(int *p)
{
    C(p);
}
void A(int *p)
{
    B(p);
}
void A2(int *p)
{
    C(p);
}
int main(int argc, char **argv)
{
    int a;
    int *p = NULL;
    A2(&a);  // A2 > C
    printf("a = 0x%x\n", a);
    A(p);    // A > B > C
    return 0;
}

複製代碼

對目標板的設置方式是:開啓端口2345作爲gdbserver銅線端口。

gdbserver :2345 test_debug

主機上執行gdb test_debug,然後tar remote 192.168.2.84.2345連接遠程gdbserver。

目標板會收到“Remote debugging from host 192.168.33.77”消息,表示兩者連接成功。

主機上就可以進行遠程調試,continue之後兩端得到的結果如下:

目標板輸出“a=0x12”之後停止運行,

主機上得到SIGSEGV,並可以查看backtrace信息。可以看出問題點在指針p指向NULL,0指針賦值錯誤。

3. 通過core+gdb離線分析

在目標板上執行ulimit -c unlimited,執行應用程序。

程序出錯後,會在當前目錄下生成core文件。

將core文件拷出後,再PC上執行xxx-linux-gdb ./test ./core進行分析。

3.1 加載庫文件

在運行xxx-linux-gdb ./test ./core之後,可能存在庫文件關聯不上的情況。

使用info sharedlibrary,查看庫加載情況。

複製代碼

From        To          Syms Read   Shared Object Library
                        No          xxx.so
                        No          /lib/libdl.so.2
                        No          /lib/libpthread.so.0
0x2ab6ec00  0x2ac09ba4  Yes         xxx/lib/libstdc++.so.6
                        No          /lib/libm.so.6
0x2acec460  0x2acf626c  Yes         xxx/lib/libgcc_s.so.1
                        No          /lib/libc.so.6
                        No          /lib/ld.so.1

複製代碼

可以通過set solib-search-path和set solib-absolute-prefix來設置,對應庫所在的路徑。

複製代碼

From        To          Syms Read   Shared Object Library
0x2aaca050  0x2aacc8d0  Yes         xxx.so
0x2aad0ad0  0x2aad17ac  Yes (*)     xxx/lib/libdl.so.2
0x2aad8a50  0x2aae7434  Yes (*)     xxx/lib/libpthread.so.0
0x2ab6ec00  0x2ac09ba4  Yes         xxx/lib/libstdc++.so.6
0x2ac4b3d0  0x2acb1988  Yes         xxx/lib/libm.so.6
0x2acec460  0x2acf626c  Yes         xxx/lib/libgcc_s.so.1
0x2ad17b80  0x2adf699e  Yes         xxx/lib/libc.so.6
0x2aaa89e0  0x2aabf66c  Yes (*)     xxx/lib/ld.so.1
(*): Shared library is missing debugging information.

複製代碼

可以看出相關庫文件都已經加載,只是部分庫文件沒有調試信息。

3.2 查看backtrace

查看coredump的backtrace通過bt即可,更全的信息通過bt full。

產看函數調用棧的幾個函數

bt:顯示所有的函數調用棧幀的信息,每個幀一行。

bt n:顯示棧定的n個幀信息。

bt -n:顯示棧底的n個幀信息。

bt full:顯示棧中所有幀的完全信息如:函數參數,本地變量。

bt full n:用法同上。

bt full -n

複製代碼

(gdb) bt
#0  0x2ad71f1e in memcpy () from xxx/lib/libc.so.6
#1  0x2ad71ac0 in memmove () from xxx/lib/libc.so.6
#2  0x0011f36c in std::__copy_move<false, true, std::random_access_iterator_tag>::__copy_m<unsigned char> (__first=0x34dfb008 "\377\330\377", <incomplete sequence \340>, __last=0x34eeea2c "", 
    ...
#3  0x0011ee22 in std::__copy_move_a<false, unsigned char*, unsigned char*> (__first=0x34dfb008 "\377\330\377", <incomplete sequence \340>, __last=0x34eeea2c "", __result=0x2b2013c0 "\377\330\377", <incomplete sequence \340>)
    at xxxinclude/c++/6.3.0/bits/stl_algobase.h:386
#4  0x0011e7e2 in std::__copy_move_a2<false, __gnu_cxx::__normal_iterator<unsigned char*, std::vector<unsigned char> >, unsigned char*> (__first=..., __last=..., __result=0x2b2013c0 "\377\330\377", <incomplete sequence \340>)
    at xxx/bits/stl_algobase.h:424
#5  0x0011dfd2 in std::copy<__gnu_cxx::__normal_iterator<unsigned char*, std::vector<unsigned char> >, unsigned char*> (__first=..., __last=..., __result=0x2b2013c0 "\377\330\377", <incomplete sequence \340>)
    at xxx/6.3.0/bits/stl_algobase.h:456
#6  0x0011c948 in xxx
#7  0x00133e08 in xxx
#8  0x2aada31e in start_thread () from xxx/libc/lib/libpthread.so.0
#9  0x005a11b4 in ?? ()

複製代碼

3.3 Core Dump核心轉存儲文件目錄和命名規則

默認情況下core文件存在應用當前路徑下,爲了區分可以進行設置。

區分core主要通過/proc/sys/kernel/core_uses_pid和/proc/sys/kernel/core_pattern進行設置。

/proc/sys/kernel/core_uses_pid:可以控制產生的core文件的文件名中是否添加pid作爲擴展,如果添加則文件內容爲1,否則爲0。

proc/sys/kernel/core_pattern:可以設置格式化的core文件保存位置或文件名,比如原來文件內容是core-%e

echo "/tmp/core-%e-%p" > core_pattern。

將會控制所產生的core文件會存放到/corefile目錄下,產生的文件名爲core-命令名-pid-時間戳

以下是參數列表:
    %p - insert pid into filename 添加pid
    %u - insert current uid into filename 添加當前uid
    %g - insert current gid into filename 添加當前gid
    %s - insert signal that caused the coredump into the filename 添加導致產生core的信號
    %t - insert UNIX time that the coredump occurred into filename 添加core文件生成時的unix時間
    %h - insert hostname where the coredump happened into filename 添加主機名
    %e - insert coredumping executable name into filename 添加命令名

當然,你可以用下列方式來完成:

sysctl -w kernel.core_pattern=/tmp/core-%e-%p

3.4 ulimit的使用

功能說明:控制shell程序的資源。

語  法:ulimit [-aHS][-c <core文件上限>][-d <數據節區大小>][-f <文件大小>][-m <內存大小>][-n <文件數目>][-p <緩衝區大小>][-s <堆疊大小>][-t <CPU時間>][-u <程序數目>][-v <虛擬內存大小>]

補充說明:ulimit爲shell內建指令,可用來控制shell執行程序的資源。

參  數:
   -a  顯示目前資源限制的設定。 
   -c <core文件上限>  設定core文件的最大值,單位爲區塊。 
   -d <數據節區大小>  程序數據節區的最大值,單位爲KB。 
   -f <文件大小>  shell所能建立的最大文件,單位爲區塊。 
   -H  設定資源的硬性限制,也就是管理員所設下的限制。 
   -m <內存大小>  指定可使用內存的上限,單位爲KB。 
   -n <文件數目>  指定同一時間最多可開啓的文件數。 
   -p <緩衝區大小>  指定管道緩衝區的大小,單位512字節。 
   -s <堆疊大小>  指定堆疊的上限,單位爲KB。 
   -S  設定資源的彈性限制。 
   -t <CPU時間>  指定CPU使用時間的上限,單位爲秒。 
   -u <程序數目>  用戶最多可開啓的程序數目。 
   -v <虛擬內存大小>  指定可使用的虛擬內存上限,單位爲KB。

4. GDB小技巧

4.1 關閉 Type <return> to continue, or q <return> to quit---

當現實內容多的時候,GDB會強制分頁,現實就會暫停。但是可能並不需要,可以通過set pagination off關閉。

4.2 附着到已運行kernel

在已運行的Linux上,如果發生死機異常等問題,這時候定位問題需要使用jtag連接上。

連接方法是:

gdb-----------------------------------------------進入gdb shell。
target remote localhost:1025-------------------在gdb shell中通過ip:port連接上target。
file vmlinux----------------------------------------加載符號表。

 

然後就可以在線查看運行狀態了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章