gcc詳解

GNU CC(簡稱爲Gcc)是GNU項目中符合ANSI C標準的編譯系統,能夠編譯用C、C++和Object C等語言編寫的程序。Gcc不僅功能強大,而且可以編譯如C、C++、Object C、Java、Fortran、Pascal、Modula-3和Ada等多種語言,而且Gcc又是一個交叉平臺編譯器,它能夠在當前CPU平臺上爲多種不同體系結構的硬件平臺開發軟件,因此尤其適合在嵌入式領域的開發編譯。本章中的示例,除非特別註明,否則均採用Gcc版本爲4.0.0。

 

 

GCC入門基礎

表3.6 Gcc所支持後綴名解釋

後 綴 名

所對應的語言

後 綴 名

所對應的語言

.c

C原始程序

.s/.S

彙編語言原始程序

.C/.cc/.cxx

C++原始程序

.h

預處理文件(頭文件)

.m

Objective-C原始程序

.o

目標文件

.i

已經過預處理的C原始程序

.a/.so

編譯後的庫文件

.ii

已經過預處理的C++原始程序



如本章開頭提到的,Gcc的編譯流程分爲了四個步驟,分別爲:

· 預處理(Pre-Processing)

· 編譯(Compiling)

· 彙編(Assembling)

· 鏈接(Linking)

下面就具體來查看一下Gcc是如何完成四個步驟的。

首先,有以下hello.c源代碼

#include<stdio.h>

int main()

{

printf("Hello! This is our embedded world!n");

return 0;

}

(1)預處理階段

在該階段,編譯器將上述代碼中的stdio.h編譯進來,並且用戶可以使用Gcc的選項”-E”進行查看,該選項的作用是讓Gcc在預處理結束後停止編譯過程。


注意

Gcc指令的一般格式爲:Gcc [選項] 要編譯的文件 [選項] [目標文件]

其中,目標文件可缺省,Gcc默認生成可執行的文件,命爲:編譯文件.out

 

[root@localhost Gcc]# Gcc –E hello.c –o hello.i

 

在此處,選項”-o”是指目標文件,由表3.6可知,”.i”文件爲已經過預處理的C原始程序。以下列出了hello.i文件的部分內容:

 

typedef int (*__gconv_trans_fct) (struct __gconv_step *,

struct __gconv_step_data *, void *,

__const unsigned char *,

__const unsigned char **,

__const unsigned char *, unsigned char **,

size_t *);

# 2 "hello.c" 2

int main()

{

printf("Hello! This is our embedded world!n");

return 0;

}

 

由此可見,Gcc確實進行了預處理,它把”stdio.h”的內容插入到hello.i文件中。

(2)編譯階段

接下來進行的是編譯階段,在這個階段中,Gcc首先要檢查代碼的規範性、是否有語法錯誤等,以確定代碼的實際要做的工作,在檢查無誤後,Gcc把代碼翻譯成彙編語言。用戶可以使用”-S”選項來進行查看,該選項只進行編譯而不進行彙編,生成彙編代碼。

 

[root@localhost Gcc]# Gcc –S hello.i –o hello.s

 

以下列出了hello.s的內容,可見Gcc已經將其轉化爲彙編了,感興趣的讀者可以分析一下這一行簡單的C語言小程序是如何用匯編代碼實現的。

 

.file "hello.c"

.section .rodata

.align 4

.LC0:

.string"Hello! This is our embedded world!"

.text

.globl main

.type main, @function

main:

pushl �p

movl %esp, �p

subl $8, %esp

andl $-16, %esp

movl $0, �x

addl $15, �x

addl $15, �x

shrl $4, �x

sall $4, �x

subl �x, %esp

subl $12, %esp

pushl $.LC0

call puts

addl $16, %esp

movl $0, �x

leave

ret

.size main, .-main

.ident "GCC: (GNU) 4.0.0 20050519 (Red Hat 4.0.0-8)"

.section .n

 

(3)彙編階段

彙編階段是把編譯階段生成的”.s”文件轉成目標文件,讀者在此可使用選項”-c”就可看到彙編代碼已轉化爲”.o”的二進制目標代碼了。如下所示:

 

[root@localhost Gcc]# Gcc –c hello.s –o hello.o

 

(4)鏈接階段

在成功編譯之後,就進入了鏈接階段。在這裏涉及到一個重要的概念:函數庫。

讀者可以重新查看這個小程序,在這個程序中並沒有定義”printf”的函數實現,且在預編譯中包含進的”stdio.h”中也只有該函數的聲明,而沒有定義函數的實現,那麼,是在哪裏實現”printf”函數的呢?最後的答案是:系統把這些函數實現都被做到名爲libc.so.6的庫文件中去了,在沒有特別指定時,Gcc會到系統默認的搜索路徑”/usr/lib”下進行查找,也就是鏈接到libc.so.6庫函數中去,這樣就能實現函數”printf”了,而這也就是鏈接的作用。

函數庫一般分爲靜態庫和動態庫兩種。靜態庫是指編譯鏈接時,把庫文件的代碼全部加入到可執行文件中,因此生成的文件比較大,但在運行時也就不再需要庫文件了。其後綴名一般爲”.a”。動態庫與之相反,在編譯鏈接時並沒有把庫文件的代碼加入到可執行文件中,而是在程序執行時由運行時鏈接文件加載庫,這樣可以節省系統的開銷。動態庫一般後綴名爲”.so”,如前面所述的libc.so.6就是動態庫。Gcc在編譯時默認使用動態庫。

完成了鏈接之後,Gcc就可以生成可執行文件,如下所示。

 

[root@localhost Gcc]# Gcc hello.o –o hello

 

運行該可執行文件,出現正確的結果如下。

 

[root@localhost Gcc]# ./hello

Hello! This is our embedded world!

Gcc編譯選項分析

Gcc有超過100個的可用選項,主要包括總體選項、告警和出錯選項、優化選項和體系結構相關選項。以下對每一類中最常用的選項進行講解。

(1)總體選項

Gcc的總結選項如表3.7所示,很多在前面的示例中已經有所涉及。

表3.7 Gcc總體選項列表

後綴名

所對應的語言

-c

只是編譯不鏈接,生成目標文件“.o”

-S

只是編譯不彙編,生成彙編代碼

-E

只進行預編譯,不做其他處理

-g

在可執行程序中包含標準調試信息

-o file

把輸出文件輸出到file裏

-v

打印出編譯器內部編譯各過程的命令行信息和編譯器的版本

-I dir

在頭文件的搜索路徑列表中添加dir目錄

-L dir

在庫文件的搜索路徑列表中添加dir目錄

-static

鏈接靜態庫

-llibrary

連接名爲library的庫文件

 

對於“-c”、“-E”、“-o”、“-S”選項在前一小節中已經講解了其使用方法,在此主要講解另外兩個非常常用的庫依賴選項“-I dir”和“-L dir”。

· “-I dir”

正如上表中所述,“-I dir”選項可以在頭文件的搜索路徑列表中添加dir目錄。由於Linux中頭文件都默認放到了“/usr/include/”目錄下,因此,當用戶希望添加放置在其他位置的頭文件時,就可以通過“-I dir”選項來指定,這樣,Gcc就會到相應的位置查找對應的目錄。

比如在“/root/workplace/Gcc”下有兩個文件:

 

 

#include<my.h>

int main()

{

printf(“Hello!!n”);

return 0;

}

 

#include<stdio.h>

 

這樣,就可在Gcc命令行中加入“-I”選項:

 

[root@localhost Gcc] Gcc hello1.c –I /root/workplace/Gcc/ -o hello1

 

這樣,Gcc就能夠執行出正確結果。

 

小知識

在include語句中,“<>”表示在標準路徑中搜索頭文件,““””表示在本目錄中搜索。故在上例中,可把hello1.c的“#include<my.h>”改爲“#include “my.h””,就不需要加上“-I”選項了。

 

· “-L dir”

默認庫的搜索路徑爲 : /lib   /usr/lib    /usr/local/lib

選項“-L dir”的功能與“-I dir”類似,能夠在庫文件的搜索路徑列表中添加dir目錄。例如有程序hello_sq.c需要用到目錄“/root/workplace/Gcc/lib”下的一個動態庫libsunq.so,則只需鍵入如下命令即可:

 

[root@localhost Gcc] Gcc hello_sq.c –L /root/workplace/Gcc/lib –lsunq –o hello_sq

 

需要注意的是,“-I dir”和“-L dir”都只是指定了路徑,而沒有指定文件,因此不能在路徑中包含文件名。

另外值得詳細解釋一下的是“-l”選項,它指示Gcc去連接庫文件libsunq.so。由於在Linux下的庫文件命名時有一個規定:必須以lib三個字母開頭。因此在用-l選項指定鏈接的庫文件名時可以省去lib三個字母。也就是說Gcc在對”-lsunq”進行處理時,會自動去鏈接名爲libsunq.so的文件。

(2)告警和出錯選項

Gcc的告警和出錯選項如表3.8所示。

表3.8 Gcc總體選項列表

選項

含義

-ansi

支持符合ANSI標準的C程序

-pedantic

允許發出ANSI C標準所列的全部警告信息

選項

含義

-pedantic-error

允許發出ANSI C標準所列的全部錯誤信息

-w

關閉所有告警

-Wall

允許發出Gcc提供的所有有用的報警信息

-werror

把所有的告警信息轉化爲錯誤信息,並在告警發生時終止編譯過程

 

下面結合實例對這幾個告警和出錯選項進行簡單的講解。

如有以下程序段:

 

#include<stdio.h>

 

void main()

{

long long tmp = 1;

printf(“This is a bad code!n”);

return 0;

}

 

這是一個很糟糕的程序,讀者可以考慮一下有哪些問題?

· “-ansi”

該選項強制Gcc生成標準語法所要求的告警信息,儘管這還並不能保證所有沒有警告的程序都是符合ANSI C標準的。運行結果如下所示:

 

[root@localhost Gcc]# Gcc –ansi warning.c –o warning

warning.c: 在函數“main”中:

warning.c:7 警告:在無返回值的函數中,“return”帶返回值

warning.c:4 警告:“main”的返回類型不是“int”

 

可以看出,該選項並沒有發現”long long”這個無效數據類型的錯誤。

· “-pedantic”

允許發出ANSI C標準所列的全部警告信息,同樣也保證所有沒有警告的程序都是符合ANSI C標準的。其運行結果如下所示:

 

[root@localhost Gcc]# Gcc –pedantic warning.c –o warning

warning.c: 在函數“main”中:

warning.c:5 警告:ISO C90不支持“long long”

warning.c:7 警告:在無返回值的函數中,“return”帶返回值

warning.c:4 警告:“main”的返回類型不是“int”

 

可以看出,使用該選項查看出了”long long”這個無效數據類型的錯誤。

· “-Wall”

允許發出Gcc能夠提供的所有有用的報警信息。該選項的運行結果如下所示:

[root@localhost Gcc]# Gcc –Wall warning.c –o warning

warning.c:4 警告:“main”的返回類型不是“int”

warning.c: 在函數”main”中:

warning.c:7 警告:在無返回值的函數中,”return”帶返回值

warning.c:5 警告:未使用的變量“tmp”

 

使用“-Wall”選項找出了未使用的變量tmp,但它並沒有找出無效數據類型的錯誤。

另外,Gcc還可以利用選項對單獨的常見錯誤分別指定警告,有關具體選項的含義感興趣的讀者可以查看Gcc手冊進行學習。

(3)優化選項

Gcc可以對代碼進行優化,它通過編譯選項“-On”來控制優化代碼的生成,其中n是一個代表優化級別的整數。對於不同版本的Gcc來講,n的取值範圍及其對應的優化效果可能並不完全相同,比較典型的範圍是從0變化到2或3。

不同的優化級別對應不同的優化處理工作。如使用優化選項“-O”主要進行線程跳轉(Thread Jump)和延遲退棧(Deferred Stack Pops)兩種優化。使用優化選項“-O2”除了完成所有“-O1”級別的優化之外,同時還要進行一些額外的調整工作,如處理器指令調度等。選項“-O3”則還包括循環展開和其他一些與處理器特性相關的優化工作。

雖然優化選項可以加速代碼的運行速度,但對於調試而言將是一個很大的挑戰。因爲代碼在經過優化之後,原先在源程序中聲明和使用的變量很可能不再使用,控制流也可能會突然跳轉到意外的地方,循環語句也有可能因爲循環展開而變得到處都有,所有這些對調試來講都將是一場噩夢。所以筆者建議在調試的時候最好不使用任何優化選項,只有當程序在最終發行的時候才考慮對其進行優化。

(4)體系結構相關選項

Gcc的體系結構相關選項如表3.9所示。

表3.9Gcc體系結構相關選項列表

選項

含義

-mcpu=type

針對不同的CPU使用相應的CPU指令。可選擇的type有i386、i486、pentium及i686等

-mieee-fp

使用IEEE標準進行浮點數的比較

-mno-ieee-fp

不使用IEEE標準進行浮點數的比較

-msoft-float

輸出包含浮點庫調用的目標代碼

-mshort

把int類型作爲16位處理,相當於short int

-mrtd

強行將函數參數個數固定的函數用ret NUM返回,節省調用函數的一條指令

 

這些體系結構相關選項在嵌入式的設計中會有較多的應用,讀者需根據不同體系結構將對應的選項進行組合處理。在本書後面涉及到具體實例會有針對性的講解。





發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章