LINUX下C++編譯器GCC

Gcc簡介

Linux系統下的gcc(GNU C Compiler)是GNU推出的功能強大、性能優越的多平臺編譯器,是GNU的代表作品之一。gcc是可以在多種硬體平臺上編譯出可執行程序的超級編譯器,其執行效率與一般的編譯器相比平均效率要高20%~30%。

gcc 編譯器能將C、C++語言源程序、匯程式化序和目標程序編譯、連接成可執行文件,如果沒有給出可執行文件的名字,gcc將生成一個名爲a.out的文件。 在Linux系統中,可執行文件沒有統一的後綴,系統從文件的屬性來區分可執行文件和不可執行文件。而gcc則通過後綴來區別輸入文件的類別,下面我們來介紹gcc所遵循的部分約定規則。

.c爲後綴的文件:  C語言源代碼文件;

.a爲後綴的文件:  是由目標文件構成的檔案庫文件;

.C,.cc或.cxx 爲後綴的文件:    是C++源代碼文件;

.h爲後綴的文件:  是程序所包含的頭文件;

.i 爲後綴的文件: 是已經預處理過的C源代碼文件;

.ii爲後綴的文件: 是已經預處理過的C++源代碼文件;

.m爲後綴的文件:  是Objective-C源代碼文件;

.o爲後綴的文件:  是編譯後的目標文件;

.s爲後綴的文件:  是彙編語言源代碼文件;

.S爲後綴的文件:  是經過預編譯的彙編語言源代碼文件。

gcc的執行過程

雖然我們稱gcc是C語言的編譯器,但使用gcc由C語言源代碼文件生成可執行文件的過程不僅僅是編譯的過程,而是要經歷四個相互關聯的步驟∶預處理(也稱 預編譯,Preprocessing)、編譯(Compilation)、彙編(Assembly)和連接(Linking)。

命令 gcc首先調用cpp進行預處理,在預處理過程中,對源代碼文件中的文件包含(include)、預編譯語句(如宏定義define等)進行分析。接着調 用cc1進行編譯,這個階段根據輸入文件生成以.o爲後綴的目標文件。彙編過程是針對彙編語言的步驟,調用as進行工作,一般來講,.S爲後綴的彙編語言 源代碼文件和彙編、.s爲後綴的彙編語言文件經過預編譯和彙編之後都生成以.o爲後綴的目標文件。當所有的目標文件都生成之後,gcc就調用ld來完成最 後的關鍵性工作,這個階段就是連接。在連接階段,所有的目標文件被安排在可執行程序中的恰當的位置,同時,該程序所調用到的庫函數也從各自所在的檔案庫中 連到合適的地方。

gcc的基本用法和選項

在使用gcc編譯器的時候,我們必須給出一系列必要的調用參數和文件名稱。gcc編譯器的調用參數大約有100多個,其中多數參數我們可能根本就用不到,這裏只介紹其中最基本、最常用的參數。

gcc最基本的用法是∶gcc [options] [filenames]

其中options就是編譯器所需要的參數,filenames給出相關的文件名稱。其中[options]的值可以爲下列值:

-c,只編譯,不連接成爲可執行文件,編譯器只是由輸入的.c等源代碼文件生成.o爲後綴的目標文件,通常用於編譯不包含主程序的子程序文件。

-o output_filename,確定輸出文件的名稱爲output_filename,同時這個名稱不能和源文件同名。如果不給出這個選項,gcc就給出預設的可執行文件a.out。

-g,產生符號調試工具(GNU的gdb)所必要的符號資訊,要想對源代碼進行調試,我們就必須加入這個選項。

-O,對程序進行優化編譯、連接,採用這個選項,整個源代碼會在編譯、連接過程中進行優化處理,這樣產生的可執行文件的執行效率可以提高,但是,編譯、連接的速度就相應地要慢一些。

-O2,比-O更好的優化編譯、連接,當然整個編譯、連接過程會更慢。

-Idirname,將dirname所指出的目錄加入到程序頭文件目錄列表中,是在預編譯過程中使用的參數。C程序中的頭文件包含兩種情況∶

A)#include

B)#include “myinc.h”

其 中,A類使用尖括號(< >),B類使用雙引號(“ ”)。對於A類,預處理程序cpp在系統預設包含文件目錄(如/usr/include)中搜尋相應的文件,而對於B類,cpp在當前目錄中搜尋頭文件, 這個選項的作用是告訴cpp,如果在當前目錄中沒有找到需要的文件,就到指定的dirname目錄中去尋找。在程序設計中,如果我們需要的這種包含文件分 別分佈在不同的目錄中,就需要逐個使用-I選項給出搜索路徑。

-Ldirname,將dirname所指出的目錄加入到程序函數檔案 庫文件的目錄列表中,是在連接過程中使用的參數。在預設狀態下,連接程序ld在系統的預設路徑中(如/usr/lib)尋找所需要的檔案庫文件,這個選項 告訴連接程序,首先到-L指定的目錄中去尋找,然後到系統預設路徑中尋找,如果函數庫存放在多個目錄下,就需要依次使用這個選項,給出相應的存放目錄。

-lname,在連接時,裝載名字爲“libname.a”的函數庫,該函數庫位於系統預設的目錄或者由-L選項確定的目錄下。例如,-lm表示連接名爲“libm.a”的數學函數庫。

上面我們簡要介紹了gcc編譯器最常用的功能和主要參數選項,更爲詳盡的資料可以參看Linux系統的聯機幫助。

爲了更加詳細的說明GCC參數極其相關的使用方法,我們再換一種方式來說明,以下爲自問自答的十個問題:

1、gcc包含的c/c++編譯器

gcc、cc、c++、g++;gcc和cc是一樣的,c++和g++是一樣的,一般c程序就用gcc編譯,c++程序就用g++編譯

2、gcc的基本用法

gcc test.c這樣將編譯出一個名爲a.out的程序,gcc test.c -o test這樣將編譯出一個名爲test的程序,-o參數用來指定生成程序的名字。

3、爲什麼會出現undefined reference to 'xxxxx'錯誤?

首先這是鏈接錯誤,不是編譯錯誤,也就是說如果只有這個錯誤,說明你的程序源碼本身沒有問題,是你用編譯器編譯時參數用得不對,你沒有指定鏈接程序 要用到得庫,比如你的程序裏用到了一些數學函數,那麼你就要在編譯參數裏指定程序要鏈接數學庫,方法是在編譯命令行里加入-lm

4、-l參數和-L參數

-l參數就是用來指定程序要鏈接的庫,-l參數緊接着就是庫名,那麼庫名跟真正的庫文件名有什麼關係呢?就拿數學庫來說,他的庫名是m,他的庫文件名是libm.so,很容易看出,把庫文件名的頭lib和尾.so去掉就是庫名了。

好了現在我們知道怎麼得到庫名,當我們自已要用到一個第三方提供的庫名字libtest.so,那麼我們只要把libtest.so拷貝到 /usr/lib裏,編譯時加上-ltest參數,我們就能用上libtest.so庫了(當然要用libtest.so庫裏的函數,我們還需要與 libtest.so配套的頭文件)。

放在/lib和/usr/lib和/usr/local/lib裏的庫直接用-l參數就能鏈接了,但如果庫文件沒放在這三個目錄裏,而是放在其他目錄裏,這時我們只用-l參數的話,鏈接還是會出錯,出錯信息大概是:“/usr/bin/ld: cannot find -lxxx”,也就是鏈接程序ld在那3個目錄裏找不到libxxx.so,這時另外一個參數-L就派上用場了,比如常用的X11的庫,它在 /usr/X11R6/lib目錄下,我們編譯時就要用-L/usr/X11R6/lib -lX11參數,-L參數跟着的是庫文件所在的目錄名。再比如我們把libtest.so放在/aaa/bbb/ccc目錄下,那鏈接參數就是- L/aaa/bbb/ccc –ltest。

另外,大部分libxxxx.so只是一個鏈接,以RH9爲例,比如libm.so它鏈接到/lib/libm.so.x,/lib/libm.so.6又鏈接到/lib/libm-2.3.2.so,如果沒有這樣的鏈接,還是會出錯,因爲ld只會找libxxxx.so,所以如果你要用到xxxx
庫,而只有libxxxx.so.x或者libxxxx-x.x.x.so,做一個鏈接就可以了

ln -s libxxxx-x.x.x.so libxxxx.so

手工來寫鏈接參數總是很麻煩的,還好很多庫開發包提供了生成鏈接參數的程序,名字一般叫xxxx-config,一般放在/usr/bin目錄下,比如gtk1.2的鏈接參數生成程序是gtk-config,執行gtk-config --libs就能得到以下輸出"-L/usr/lib -L/usr/X11R6/lib -lgtk -lgdk -rdynamic

-lgmodule -lglib -ldl -lXi -lXext -lX11 -lm",這就是編譯一個gtk1.2程序所需的gtk鏈接參數,xxx-config除了--libs參數外還有一個參數是--cflags用來生成頭文件包含目錄的,也就是-I參數,在下面我們將會講到。你可以試試執行gtk-config --libs --cflags,看看輸出結果。

現在的問題就是怎樣用這些輸出結果了,最笨的方法就是複製粘貼或者照抄,聰明的辦法是在編譯命令行里加入這個`xxxx-config --libs --cflags`,比如編譯一個gtk程序:gcc gtktest.c `gtk-config --libs --cflags`這樣
就差不多了。注意`不是單引號,而是1鍵左邊那個鍵。

除了xxx-config以外,現在新的開發包一般都用pkg-config來生成鏈接參數,使用方法跟xxx-config類似,但xxx-config是針對特定的開發包,但pkg-config包含很多開發包的鏈接參數的生成,用pkg-config --list-all命令可以列出所支持的所有開發包,pkg-config的用法就是pkg -config pagName --libs --cflags,其中pagName是包名,是pkg-config--list-all裏列出名單中的一個,比如gtk1.2的名字就是gtk+, pkg-config gtk+ --libs --cflags的作用跟gtk-config --libs --cflags是一樣的。比如:

gcc gtktest.c `pkg-config gtk+ --libs --cflags`

5、-include和-I參數

-include用來包含頭文件,但一般情況下包含頭文件都在源碼裏用#include xxxxxx實現,-include參數很少用。-I參數是用來指定頭文件目錄,/usr/include目錄一般是不用指定的,gcc知道去那裏找,但是如果頭文件不在/usr/include裏我們就要用-I參數指定了,比如頭文件放在/myinclude目錄裏,那編譯命令行就要加上- I/myinclude參數了,如果不加你會得到一個"xxxx.h: No such file or directory"的錯誤。-I參數可以用相對路徑,比如頭文件在當前目錄,可以用-I.來指定。上面我們提到的--cflags參數就是用來生成-I 參數的

6、-O參數

這是一個程序優化參數,一般用-O2就是,用來優化程序用的,比如gcc test.c -O2,優化得到的程序比沒優化的要小,執行速度可能也有所提高

7、-shared參數

編譯動態庫時要用到,比如gcc -shared test.c -o libtest.so

8、幾個相關的環境變量

PKG_CONFIG_PATH:用來指定pkg-config用到的pc文件的路徑,默認是/usr/lib/pkgconfig,pc文件是文本文件,擴展名是.pc,裏面定義開發包的安裝路徑,Libs參數和Cflags參數等等。

CC:用來指定c編譯器

CXX:用來指定cxx編譯器

LIBS:跟上面的--libs作用差不多

CFLAGS:跟上面的--cflags作用差不多

CC,CXX,LIBS,CFLAGS手動編譯時一般用不上,在做configure時有時用到,一般情況下不用管。

環境變量設定方法:export ENV_NAME=xxxxxxxxxxxxxxxxx

9、關於交叉編譯

交叉編譯通俗地講就是在一種平臺上編譯出能運行在體系結構不同的另一種平臺上,比如在我們地PC平臺(X86 CPU)上編譯出能運行在sparc CPU平臺上的程序,編譯得到的程序在X86 CPU平臺上是不能運行的,必須放到sparc CPU平臺上才能運行。當然兩個平臺用的都是linux,這種方法在異平臺移植和嵌入式開發時用得非常普遍。相對與交叉編譯,我們平常做的編譯就叫本地編譯,也就是在當前平臺編譯,編譯得到的程序也是在本地執行。用來編譯這種程序的編譯器就叫交叉編譯器,相對來說,用來做本地編譯的就叫本地編譯器,一般用的都是gcc,但這種gcc跟本地的gcc編譯器是不一樣的,需要在編譯gcc時用特定的configure參數才能得到支持交叉編譯的gcc。爲了不跟本地編譯器混淆,交叉編譯器的名字一般都有前綴,比如sparc-xxxx-linux-gnu-gcc,sparc-xxxx-linux-gnu-g++ 等等。

10、交叉編譯器的使用方法

使用方法跟本地的gcc差不多,但有一點特殊的是:必須用-L和-I參數指定編譯器用spar c系統的庫和頭文件,不能用本地(X86)的庫(頭文件有時可以用本地的)

例子:

sparc-xxxx-linux-gnu-gcc test.c -L/path/to/sparcLib

-I/path/to/sparcInclude

gcc的錯誤類型及對策

gcc 編譯器如果發現源程序中有錯誤,就無法繼續進行,也無法生成最終的可執行文件。爲了便於修改,gcc給出錯誤資訊,我們必須對這些錯誤資訊逐個進行分析、 處理,並修改相應的語言,才能保證源代碼的正確編譯連接。gcc給出的錯誤資訊一般可以分爲四大類,下面我們分別討論其產生的原因和對策。

第一類∶C語法錯誤

錯誤資訊∶文件source.c中第n行有語法錯誤(syntex errror)。這種類型的錯誤,一般都是C語言的語法錯誤,應該仔細檢查源代碼文件中第n行及該行之前的程序,有時也需要對該文件所包含的頭文件進行檢 查。有些情況下,一個很簡單的語法錯誤,gcc會給出一大堆錯誤,我們最主要的是要保持清醒的頭腦,不要被其嚇倒,必要的時候再參考一下C語言的基本教 材。

第二類∶頭文件錯誤

錯誤資訊∶找不到頭文件head.h(Can not find include file head.h)。這類錯誤是源代碼文件中的包含頭文件有問題,可能的原因有頭文件名錯誤、指定的頭文件所在目錄名錯誤等,也可能是錯誤地使用了雙引號和尖括號。

第三類∶檔案庫錯誤

錯誤資訊∶連接程序找不到所需的函數庫,例如∶

ld: -lm: No such file or directory

這類錯誤是與目標文件相連接的函數庫有錯誤,可能的原因是函數庫名錯誤、指定的函數庫所在目錄名稱錯誤等,檢查的方法是使用find命令在可能的目錄中尋找相應的函數庫名,確定檔案庫及目錄的名稱並修改程序中及編譯選項中的名稱。

第四類∶未定義符號

錯 誤資訊∶有未定義的符號(Undefined symbol)。這類錯誤是在連接過程中出現的,可能有兩種原因∶一是使用者自己定義的函數或者全局變量所在源代碼文件,沒有被編譯、連接,或者乾脆還沒 有定義,這需要使用者根據實際情況修改源程序,給出全局變量或者函數的定義體;二是未定義的符號是一個標準的庫函數,在源程序中使用了該庫函數,而連接過 程中還沒有給定相應的函數庫的名稱,或者是該檔案庫的目錄名稱有問題,這時需要使用檔案庫維護命令ar檢查我們需要的庫函數到底位於哪一個函數庫中,確定 之後,修改gcc連接選項中的-l和-L項。

排除編譯、連接過程中的錯誤,應該說這只是程序設計中最簡單、最基本的一個步驟,可以說 只是開了個頭。這個過程中的錯誤,只是我們在使用C語言描述一個算法中所產生的錯誤,是比較容易排除的。我們寫一個程序,到編譯、連接通過爲止,應該說剛 剛開始,程序在運行過程中所出現的問題,是算法設計有問題,說得更玄點是對問題的認識和理解不夠,還需要更加深入地測試、調試和修改。一個程序,稍爲複雜 的程序,往往要經過多次的編譯、連接和測試、修改。下面我們學習的程序維護、調試工具和版本維護就是在程序調試、測試過程中使用的,用來解決調測階段所出 現的問題。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章