GCC的命令剖析--四步走
從上面我們知道GCC編譯源代碼生成最終可執行的二進制程序,GCC後臺隱含執行了四個階段步驟。
GCC編譯C源碼有四個步驟:預處理----->
編譯 ----> 彙編 ---->
鏈接
現在我們就用GCC的命令選項來逐個剖析GCC過程。
1)預處理(Pre-processing)
在該階段,編譯器將C源代碼中的包含的頭文件如stdio.h編譯進來,用戶可以使用gcc的選項”-E”進行查看。
用法:#gcc -E hello.c -o
hello.i
作用:將hello.c預處理輸出hello.i文件。
[root]# gcc -E hello.c -o
hello.i
[root]# ls
hello.c hello.i
[root]# vi hello.i
# 1
"hello.c"
# 1 "<built-in>"
# 1 "<command line>"
# 1
"hello.c"
# 1 "/usr/include/stdlib.h" 1 3
# 25 "/usr/include/stdlib.h"
3
# 1 "/usr/include/features.h" 1 3
# 291 "/usr/include/features.h" 3
#
1 "/usr/include/sys/cdefs.h" 1 3
# 292 "/usr/include/features.h" 2 3
# 314
"/usr/include/features.h" 3
# 1 "/usr/include/gnu/stubs.h" 1 3
# 315
"/usr/include/features.h" 2 3
# 26 "/usr/include/stdlib.h" 2 3
# 3
"hello.c" 2
void main(void)
{
printf("hello
world!/r/n");
}
2)編譯階段(Compiling)
第二步進行的是編譯階段,在這個階段中,Gcc首先要檢查代碼的規範性、是否有語法錯誤等,以確定代碼的實際要做的工作,在檢查無誤後,Gcc把代碼翻譯成彙編語言。用戶可以使用”-S”選項來進行查看,該選項只進行編譯而不進行彙編,生成彙編代碼。
選項
-S
用法:[root]# gcc –S hello.i –o hello.s
作用:將預處理輸出文件hello.i彙編成hello.s文件。
[root@richard hello-gcc]# ls
hello.c
hello.i hello.s
如下爲hello.s彙編代碼
[root@richard hello-gcc]# vi
hello.s
.file "hello.c"
.section .rodata
.LC0:
.string "hello
world!/r/n"
.text
.globl main
.type
main,@function
main:
pushl %ebp
movl %esp, %ebp
subl $8,
%esp
andl $-16, %esp
movl $0, %eax
subl %eax, %esp
subl
$12, %esp
pushl $.LC0
call printf
addl $16, %esp
movl $0,
%eax
leave
ret
.Lfe1:
.size main,.Lfe1-main
.ident "GCC: (GNU)
3.2.2 20030222 (Red Hat Linux
3.2.2-5)"
3)彙編階段(Assembling)
彙編階段是把編譯階段生成的”.s”文件轉成二進制目標代碼.
選項
-c
用法:[root]# gcc –c hello.s –o
hello.o
作用:將彙編輸出文件test.s編譯輸出test.o文件。
[root]# gcc -c hello.s -o
hello.o
[root]# ls
hello.c hello.i hello.o
hello.s
4)鏈接階段(Link)
在成功編譯之後,就進入了鏈接階段。
無選項鍊接
用法:[root]# gcc hello.o –o
hello.exe
作用:將編譯輸出文件hello.o鏈接成最終可執行文件hello.exe。
[root]#
ls
hello.c hello.exe hello.i hello.o hello.s
運行該可執行文件,出現正確的結果如下。
[root@localhost Gcc]# ./hello
Hello World!
在這裏涉及到一個重要的概念:函數庫。
讀者可以重新查看這個小程序,在這個程序中並沒有定義”printf”的函數實現,且在預編譯中包含進的”stdio.h”中也只有該函數的聲明,而沒有定義函數的實現,那麼,是在哪裏實現”printf”函數的呢?最後的答案是:系統把這些函數實現都被做到名爲libc.so.6的庫文件中去了,在沒有特別指定時,gcc會到系統默認的搜索路徑”/usr/lib”下進行查找,也就是鏈接到libc.so.6庫函數中去,這樣就能實現函數”printf”
了,而這也就是鏈接的作用。
你可以用ldd命令查看動態庫加載情況:
[root]# ldd hello.exe
libc.so.6 =>
/lib/tls/libc.so.6 (0x42000000)
/lib/ld-linux.so.2 => /lib/ld-linux.so.2
(0x40000000)
函數庫一般分爲靜態庫和動態庫兩種。靜態庫是指編譯鏈接時,把庫文件的代碼全部加入到可執行文件中,因此生成的文件比較大,但在運行時也就不再需要庫文件了。其後綴名一般爲”.a”。動態庫與之相反,在編譯鏈接時並沒有把庫文件的代碼加入到可執行文件中,而是在程序執行時由運行時鏈接文件加載庫,這樣可以節省系統的開銷。動態庫一般後綴名爲”.so”,如前面所述的libc.so.6就是動態庫。gcc在編譯時默認使用動態庫。
動態庫*.so在linux下用c和c++編程時經常會碰到,最近在網站找了幾篇文章介紹動態庫的編譯和鏈接,總算搞懂了這個之前一直不太瞭解得東東,這裏做個筆記,也爲其它正爲動態庫鏈接庫而苦惱的兄弟們提供一點幫助。
1、動態庫的編譯
下面通過一個例子來介紹如何生成一個動態庫。這裏有一個頭文件:so_test.h,三個.c文件:test_a.c、test_b.c、test_c.c,我們將這幾個文件編譯成一個動態庫:libtest.so。
so_test.h:
#include
#include
void test_a();
void
test_b();
void test_c();
test_a.c:
#include
"so_test.h"
void test_a()
{
printf("this is in
test_a.../n");
}
test_b.c:
#include
"so_test.h"
void test_b()
{
printf("this is in
test_b.../n");
}
test_a.c:
#include
"so_test.h"
void test_c()
{
printf("this is in
test_c.../n");
}
將這幾個文件編譯成一個動態庫:libtest.so
$
gcc test_a.c test_b.c test_c.c -fPIC -shared -o
libtest.so
2、動態庫的鏈接
在1、中,我們已經成功生成了一個自己的動態鏈接庫libtest.so,下面我們通過一個程序來調用這個庫裏的函數。程序的源文件爲:test.c。
test.c:
#include
"so_test.h"
int
main()
{
test_a();
test_b();
test_c();
return
0;
}
l 將test.c與動態庫libtest.so鏈接生成執行文件test:
$
gcc test.c -L. -ltest -o test
l
測試是否動態連接,如果列出libtest.so,那麼應該是連接正常了
$ ldd test
l
執行test,可以看到它是如何調用動態庫中的函數的。
3、編譯參數解析
最主要的是GCC命令行的一個選項:
-shared
該選項指定生成動態連接庫(讓連接器生成T類型的導出符號表,有時候也生成弱連接W類型的導出符號),不用該標誌外部程序無法連接。相當於一個可執行文件
l
-fPIC:表示編譯爲位置獨立的代碼,不用此選項的話編譯後的代碼是位置相關的所以動態載入時是通過代碼拷貝的方式來滿足不同進程的需要,而不能達到真正代碼段共享的目的。
l
-L.:表示要連接的庫在當前目錄中
l
-ltest:編譯器查找動態連接庫時有隱含的命名規則,即在給出的名字前面加上lib,後面加上.so來確定庫的名稱
l
LD_LIBRARY_PATH:這個環境變量指示動態連接器可以裝載動態庫的路徑。
l
當然如果有root權限的話,可以修改/etc/ld.so.conf文件,然後調用
/sbin/ldconfig來達到同樣的目的,不過如果沒有root權限,那麼只能採用輸出LD_LIBRARY_PATH的方法了。
4、注意
調用動態庫的時候有幾個問題會經常碰到,有時,明明已經將庫的頭文件所在目錄
通過 “-I” include進來了,庫所在文件通過
“-L”參數引導,並指定了“-l”的庫名,但通過ldd命令察看時,就是死活找不到你指定鏈接的so文件,這時你要作的就是通過修改
LD_LIBRARY_PATH或者/etc/ld.so.conf文件來指定動態庫的目錄。通常這樣做就可以解決庫無法鏈接的問題了。