[轉]GCC

 

gcc

 

  由GNU之父Stallman所開發的linux下的編譯器,全稱爲GNU Compiler Collection, 目前可以編譯的語言包括:C, C++, Objective-C, Fortran, Java, and Ada, 可以在其官方頁面找到更加詳細的信息
  GCC是一個原本用於Unix-like系統下編程的編譯器。不過,現在GCC也有了許多Win32下的移植版本。這要感謝Internet上衆多程序員的共同努力。
  *Win32 下的 GCC 詳細可察看詞條:GCC for Win32

歷史   GCC是GNU公社的一個項目。是一個用於編程開發的自由編譯器。最初,GCC只是一個C語言編譯器,他是GNU C Compiler 的英文縮寫。隨着衆多自由開發者的加入和GCC自身的發展,如今的GCC以經是一個包含衆多語言的編譯器了。其中包括 C,C++,Ada,Object C和Java等。所以,GCC也由原來的GNU C Compiler變爲GNU Compiler Collection。也就是 GNU編譯器家族 的意思。當然,如今的GCC藉助於他的特性,具有了交叉編譯器的功能,即在一個平臺下編譯另一個平臺的代碼。
  直到現在,GCC的歷史仍然在繼續,他的傳奇仍然被人所傳頌。
  Linux系統下的Gcc(GNU C Compiler)是GNU推出的功能強大、性能優越的多平臺編譯器,是GNU的代表作品之一。gcc是可以在多種硬體平臺上編譯出可執行程序的超級編譯器,其執行效率與一般的編譯器相比平均效率要高20%~30%。
  Gcc編譯器能將C、C++語言源程序、匯程式化序和目標程序編譯、連接成可執行文件,如果沒有給出可執行文件的名字,gcc將生成一個名爲a.out的文件。在Linux系統中,可執行文件沒有統一的後綴,系統從文件的屬性來區分可執行文件和不可執行文件。而gcc則通過後綴來區別輸入文件的類別,下面我們來介紹gcc所遵循的部分約定規則。
  .c爲後綴的文件,C語言源代碼文件;
  .a爲後綴的文件,是由目標文件構成的檔案庫文件;
  .C,.cc或.cxx 爲後綴的文件,是C++源代碼文件;
  .h爲後綴的文件,是程序所包含的頭文件;
  .i 爲後綴的文件,是已經預處理過的C源代碼文件;
  .ii爲後綴的文件,是已經預處理過的C++源代碼文件;
  .m爲後綴的文件,是Objective-C源代碼文件;
  .o爲後綴的文件,是編譯後的目標文件;
  .s爲後綴的文件,是彙編語言源代碼文件;
  .S爲後綴的文件,是經過預編譯的彙編語言源代碼文件。

GCC的執行過程   雖然我們稱Gcc是C語言的編譯器,但使用gcc由C語言源代碼文件生成可執行文件的過程不僅僅是編譯的過程,而是要經歷四個相互關聯的步驟∶預處理(也稱預編譯,Preprocessing)、編譯(Compilation)、彙編(Assembly)和連接(Linking)。
  命令gcc首先調用cpp進行預處理,在預處理過程中,對源代碼文件中的文件包含(include)、預編譯語句(如宏定義define等)進行分析。接着調用cc1進行編譯,這個階段根據輸入文件生成以.o爲後綴的目標文件。彙編過程是針對彙編語言的步驟,調用as進行工作,一般來講,.S爲後綴的彙編語言源代碼文件和彙編、.s爲後綴的彙編語言文件經過預編譯和彙編之後都生成以.o爲後綴的目標文件。當所有的目標文件都生成之後,gcc就調用ld來完成最後的關鍵性工作,這個階段就是連接。在連接階段,所有的目標文件被安排在可執行程序中的恰當的位置,同時,該程序所調用到的庫函數也從各自所在的檔案庫中連到合適的地方。

GCC的基本用法和選項   在使用Gcc編譯器的時候,我們必須給出一系列必要的調用參數和文件名稱。Gcc編譯器的調用參數大約有100多個,其中多數參數我們可能根本就用不到,這裏只介紹其中最基本、最常用的參數。
  Gcc最基本的用法是∶gcc [options] [filenames]
  其中options就是編譯器所需要的參數,filenames給出相關的文件名稱。
  -c,只編譯,不連接成爲可執行文件,編譯器只是由輸入的.c等源代碼文件生成.o爲後綴的目標文件,通常用於編譯不包含主程序的子程序文件。
  -o output_filename,確定輸出文件的名稱爲output_filename,同時這個名稱不能和源文件同名。如果不給出這個選項,gcc就給出預設的可執行文件a.out。
  -g,產生符號調試工具(GNU的gdb)所必要的符號資訊,要想對源代碼進行調試,我們就必須加入這個選項。
  -O,對程序進行優化編譯、連接,採用這個選項,整個源代碼會在編譯、連接過程中進行優化處理,這樣產生的可執行文件的執行效率可以提高,但是,編譯、連接的速度就相應地要慢一些。
  -O2,比-O更好的優化編譯、連接,當然整個編譯、連接過程會更慢。
  -Idirname,將dirname所指出的目錄加入到程序頭文件目錄列表中,是在預編譯過程中使用的參數。C程序中的頭文件包含兩種情況∶
  A)#include
  B)#include “myinc.h”
  其中,A類使用尖括號(< >),B類使用雙引號(“ ”)。對於A類,預處理程序cpp在系統預設包含文件目錄(如/usr/include)中搜尋相應的文件,而%B
  GCC手冊:http://www.shanghai.ws/gnu/gcc_1.htm

GCC教程   

準備工作   如果你還沒裝編譯環境或自己不確定裝沒裝,不妨先執行
  sudo apt-get install build-essential
  如果你需要編譯 Fortran 程序,那麼還需要安裝 gfortran(或 g77)
  sudo apt-get install gfortran
  如果你已經瞭解一些 vim 的知識,而且想用它來編輯源代碼,那麼我們不妨裝個完整版
  sudo apt-get install vim-full
  如果你不瞭解vim,選擇gedit、kate或mousepad來編輯源代碼就好了
  注意:本文可能會讓你失望,如果你看完後有下列疑問的話:爲什麼要在終端輸命令啊? GCC 是什麼東西,怎麼在菜單中找不到? GCC 不能有像 VC 那樣的窗口嗎?…… 那麼你真正想要了解的可能是 anjuta,kdevelop,geany,code blocks,eclipse,neatbean 等 IDE 集成開發環境。即使在這種情況下,由於 GCC 是以上 IDE 的後臺的編譯器,本文仍值得你稍作了解。

編譯簡單的 C 程序   C 語言經典的入門例子是 Hello World,下面是一示例代碼:
  #include <stdio.h>
  int main(void)
  {
  printf("Hello, world!/n");
  return 0;
  }
  我們假定該代碼存爲文件‘hello.c’。要用 gcc 編譯該文件,使用下面的命令:
  $ gcc -Wall hello.c -o hello
  該命令將文件‘hello.c’中的代碼編譯爲機器碼並存儲在可執行文件 ‘hello’中。機器碼的文件名是通過 -o 選項指定的。該選項通常作爲命令行中的最後一個參數。如果被省略,輸出文件默認爲 ‘a.out’。
  注意到如果當前目錄中與可執行文件重名的文件已經存在,它將被複蓋。
  選項 -Wall 開啓編譯器幾乎所有常用的警告──強烈建議你始終使用該選項。編譯器有很多其他的警告選項,但 -Wall 是最常用的。默認情況下GCC 不會產生任何警告信息。當編寫 C 或 C++ 程序時編譯器警告非常有助於檢測程序存在的問題。
  本例中,編譯器使用了 -Wall 選項而沒產生任何警告,因爲示例程序是完全合法的。
  要運行該程序,輸入可執行文件的路徑如下:
  $ ./hello
  Hello, world!
  這將可執行文件載入內存,並使 CPU 開始執行其包含的指令。 路徑 ./ 指代當前目錄,因此 ./hello 載入並執行當前目錄下的可執行文件 ‘hello’。

捕捉錯誤   如上所述,當用 C 或 C++ 編程時,編譯器警告是非常重要的助手。爲了說明這一點,下面的例子包含一個微妙的錯誤:爲一個整數值錯誤地指定了一浮點數控制符‘%f’。
  #include <stdio.h>
  int
  main (void)
  {
  printf ("Two plus two is %f/n", 4);
  return 0;
  }
  一眼看去該錯誤並不明顯,但是它可被編譯器捕捉到,只要啓用了警告選項 -Wall。
  編譯上面的程序‘bad.c’,將得到如下的消息:
  $ gcc -Wall bad.c -o bad
  bad.c: In function 'main':
  bad.c:6: warning: double format, different type arg (arg 2)
  這表明文件 ‘bad.c’第 6 行中的格式字符串用法不正確。GCC 的消息總是具有下面的格式 文件名:行號:消息。編譯器對錯誤與警告區別對待,前者將阻止編譯,後者表明可能存在的問題但並不阻止程序編譯。
  本例中,對整數值來說,正確的格式控制符應該是 %d。
  如果不啓用 -Wall,程序表面看起來編譯正常,但是會產生不正確的結果:
  $ gcc bad.c -o bad
  $ ./bad
  Two plus two is 2.585495
  顯而易見,開發程序時不檢查警告是非常危險的。如果有函數使用不當,將可能導致程序崩潰或產生錯誤的結果。開啓編譯器警告選項 -Wall 可捕捉 C 編程時的多數常見錯誤。

編譯多個源文件   一個源程序可以分成幾個文件。這樣便於編輯與理解,尤其是程序非常大的時候。這也使各部分獨立編譯成爲可能。
  下面的例子中我們將程序 Hello World 分割成 3 個文件:‘main.c’,‘hello_fn.c’和頭文件‘hello.h’。這是主程序‘main.c’:
  #include "hello.h"
  int
  main(void)
  {
  hello ("world");
  return 0;
  }
  在先前的例子‘hello.c’中,我們調用的是庫函數 printf,本例中我們用一個定義在文件‘hello_fn.c’中的函數 hello 取代它。
  主程序中包含有頭文件‘hello.h’,該頭文件包含函數 hello 的聲明。我們不需要在‘main.c’文件中包含系統頭文件‘stdio.h’來聲明函數 printf,因爲‘main.c’沒有直接調用 printf。
  文件‘hello.h’中的聲明只用了一行就指定了函數 hello 的原型。
  void hello (const char * name);
  函數 hello 的定義在文件‘hello_fn.c’中:
  #include <stdio.h>
  #include "hello.h"
  void
  hello (const char * name)
  {
  printf ("Hello, %s!/n", name);
  }
  語句 #include "FILE.h" 與 #include <FILE.h> 有所不同:前者在搜索系統頭文件目錄之前將先在當前目錄中搜索文件‘FILE.h’,後者只搜索系統頭文件而不查看當前目錄。
  要用gcc編譯以上源文件,使用下面的命令:
  $ gcc -Wall main.c hello_fn.c -o newhello
  本例中,我們使用選項 -o 爲可執行文件指定了一個不同的名字 newhello。注意到頭文件‘hello.h’並未在命令行中指定。源文件中的的 #include "hello.h" 指示符使得編譯器自動將其包含到合適的位置。
  要運行本程序,輸入可執行文件的路徑名:
  $ ./newhello
  Hello, world!
  源程序各部分被編譯爲單一的可執行文件,它與我們先前的例子產生的結果相同。

簡單的 Makefile 文件   爲便於不熟悉 make 的讀者理解,本節提供一個簡單的用法示例。Make 憑藉本身的優勢,可在所有的 Unix 系統中被找到。要了解關於Gnu make 的更多信息,請參考 Richard M. Stallman 和 Roland McGrath 編寫的 GNU Make 手冊。
  Make 從 makefile(默認是當前目錄下的名爲‘Makefile’的文件)中讀取項目的描述。makefile指定了一系列目標(比如可執行文件)和依賴(比如對象文件和源文件)的編譯規則,其格式如下:
  目標: 依賴
          命令
  對每一個目標,make 檢查其對應的依賴文件修改時間來確定該目標是否需要利用對應的命令重新建立。注意到,makefile 中命令行必須以單個的 TAB 字符進行縮進,不能是空格。
  GNU Make 包含許多默認的規則(參考隱含規則)來簡化 makefile 的構建。比如說,它們指定‘.o’文件可以通過編譯‘.c’文件得到,可執行文件可以通過將‘.o’鏈接到一起獲得。隱含規則通過被叫做make變量的東西所指定,比如 CC(C 語言編譯器)和 CFLAGS(C程序的編譯選項);在makefile文件中它們通過獨佔一行的 變量=值 的形式被設置。對 C++ ,其等價的變量是CXX和CXXFLAGS,而變量CPPFLAGS則是編譯預處理選項。
  現在我們爲上一節的項目寫一個簡單的 makefile 文件:
  CC=gcc
  CFLAGS=-Wall
  hello: hello.o hello_fn.o
  clean:
          rm -f hello hello.o hello_fn.o
  該文件可以這樣來讀:使用 C 語言編譯器 gcc,和編譯選項‘-Wall’,從對象文件‘hello.o’和‘hello_fn.o’生成目標可執行文件 hello(文件‘hello.o’和‘hello_fn.o’通過隱含規則分別由‘hello.c’和‘hello_fn.c’生成)。目標clean沒有依賴文件,它只是簡單地移除所有編譯生成的文件。rm命令的選項 ‘-f’(force) 抑制文件不存在時產生的錯誤消息。
  要使用該 makefile 文件,輸入 make。不加參數調用make時,makefile文件中的第一個目標被建立,從而生成可執行文件‘hello’:
  $ make
  gcc -Wall -c -o hello.o hello.c
  gcc -Wall -c -o hello_fn.o hello_fn.c
  gcc hello.o hello_fn.o -o hello
  $ ./hello
  Hello, world!
  一個源文件被修改要重新生成可執行文件,簡單地再次輸入 make 即可。通過檢查目標文件和依賴文件的時間戳,程序 make 可識別哪些文件已經修改並依據對應的規則更新其對應的目標文件:
  $ vim hello.c (打開編輯器修改一下文件)
  $ make
  gcc -Wall -c -o hello.o hello.c
  gcc hello.o hello_fn.o -o hello
  $ ./hello
  Hello, world!
  最後,我們移除 make 生成的文件,輸入 make clean:
  $ make clean
  rm -f hello hello.o hello_fn.o
  一個專業的 makefile文件通常包含用於安裝(make install)和測試(make check)等額外的目標。
  本文中涉及到的例子都足夠簡單以至於可以完全不需要makefile,但是對任何大些的程序都使用 make 是很有必要的。

鏈接外部庫   庫是預編譯的目標文件(object files)的集合,它們可被鏈接進程序。靜態庫以後綴爲‘.a’的特殊的存檔文件(archive file)存儲。
  標準系統庫可在目錄 /usr/lib 與 /lib 中找到。比如,在類 Unix 系統中 C 語言的數學庫一般存儲爲文件 /usr/lib/libm.a。該庫中函數的原型聲明在頭文件 /usr/include/math.h 中。C 標準庫本身存儲爲 /usr/lib/libc.a,它包含 ANSI/ISO C 標準指定的函數,比如‘printf’。對每一個 C 程序來說,libc.a 都默認被鏈接。
  下面的是一個調用數學庫 libm.a 中 sin 函數的的例子,創建文件calc.c:
  #include <math.h>
  #include <stdio.h>
  int
  main (void)
  {
  double x = sin (2.0);
  printf ("The value of sin(2.0) is %f/n", x);
  return 0;
  }
  嘗試單獨從該文件生成一個可執行文件將導致一個鏈接階段的錯誤:
  $ gcc -Wall calc.c -o calc
  /tmp/ccbR6Ojm.o: In function 'main':
  /tmp/ccbR6Ojm.o(.text+0x19): undefined reference to ‘sin’
  函數 sin,未在本程序中定義也不在默認庫‘libc.a’中;除非被指定,編譯器也不會鏈接‘libm.a’。
  爲使編譯器能將 sin 鏈接進主程序‘calc.c’,我們需要提供數學庫‘libm.a’。一個容易想到但比較麻煩的做法是在命令行中顯式地指定它:
  $ gcc -Wall calc.c /usr/lib/libm.a -o calc
  函數庫‘libm.a’包含所有數學函數的目標文件,比如sin,cos,exp,log及sqrt。鏈接器將搜索所有文件來找到包含 sin 的目標文件。
  一旦包含 sin 的目標文件被找到,主程序就能被鏈接,一個完整的可執行文件就可生成了:
  $ ./calc
  The value of sin(2.0) is 0.909297
  可執行文件包含主程序的機器碼以及函數庫‘libm.a’中 sin 對應的機器碼。
  爲避免在命令行中指定長長的路徑,編譯器爲鏈接函數庫提供了快捷的選項‘-l’。例如,下面的命令
  $ gcc -Wall calc.c -lm -o calc
  與我們上面指定庫全路徑‘/usr/lib/libm.a’的命令等價。
  一般來說,選項 -lNAME使鏈接器嘗試鏈接系統庫目錄中的函數庫文件 libNAME.a。一個大型的程序通常要使用很多 -l 選項來指定要鏈接的數學庫,圖形庫,網絡庫等。
  編譯C++與Fortran
  GCC 是 GNU 編譯器集合(GNU Compiler Collection)的首字母縮寫詞。GNU 編譯器集合包含 C,C++,Objective-C,Fortran,Java 和 Ada 的前端以及這些語言對應的庫(libstdc++,libgcj,……)。
  前面我們只涉及到 C 語言,那麼如何用 gcc 編譯其他語言呢?本節將簡單介紹 C++ 和 Fortran 編譯的例子。
  首先我們嘗試編譯簡單的 C++ 的經典程序 Hello world:
  #include <iostream>
  int main(int argc,char *argv[])
  {
  std::cout << "hello, world/n";
  return 0;
  }
  將文件保存爲‘hello.cpp’,用 gcc 編譯,結果如下:
  $ gcc -Wall hello.cpp -o hello
  /tmp/cch6oUy9.o: In function `__static_initialization_and_destruction_0(int, int)':
  hello.cpp:(.text+0x23): undefined reference to `std::ios_base::Init::Init()'
  /tmp/cch6oUy9.o: In function `__tcf_0':
  hello.cpp:(.text+0x6c): undefined reference to `std::ios_base::Init::~Init()'
  /tmp/cch6oUy9.o: In function `main':
  hello.cpp:(.text+0x8e): undefined reference to `std::cout'
  hello.cpp:(.text+0x93): undefined reference to `std::basic_ostream<char, std::char_traits<char> >& std::operator<< <std::char_traits<char> >(std::basic_ostream<char, std::char_traits<char> >&, char const*)'
  /tmp/cch6oUy9.o:(.eh_frame+0x11): undefined reference to `__gxx_personality_v0'
  collect2: ld returned 1 exit status
  出錯了!!而且錯誤還很多,很難看懂,這可怎麼辦呢?在解釋之前,我們先試試下面的命令:
  $ gcc -Wall hello.cpp -o hello -lstdc++
  噫,加上-lstdc++選項後,編譯竟然通過了,而且沒有任何警告。運行程序,結果如下:
  $ ./hello
  hello, world
  通過上節,我們可以知道,-lstdc++ 選項用來通知鏈接器鏈接靜態庫 libstdc++.a。而從字面上可以看出,libstdc++.a 是C++ 的標準庫,這樣一來,上面的問題我們就不難理解了──編譯 C++ 程序,需要鏈接 C++ 的函數庫 libstdc++.a。
  編譯 C 的時候我們不需要指定 C 的函數庫,爲什麼 C++ 要指定呢?這是由於早期 gcc 是指 GNU 的 C 語言編譯器(GNU C Compiler),隨着 C++,Fortran 等語言的加入,gcc的含義才變化成了 GNU 編譯器集合(GNU Compiler Collection)。C作爲 gcc 的原生語言,故編譯時不需額外的選項。
  不過幸運的是,GCC 包含專門爲 C++ 、Fortran 等語言的編譯器前端。於是,上面的例子,我們可以直接用如下命令編譯:
  $ g++ -Wall hello.cpp -o hello
  GCC 的 C++ 前端是 g++,而 Fortran 的情況則有點複雜:在 gcc-4.0 版本之前,Fortran 前端是 g77,而gcc-4.0之後的版本對應的 Fortran 前端則改爲 gfortran。下面我們先寫一個簡單的 Fortran 示例程序:
  C Fortran 示例程序
  PROGRAM HELLOWORLD
  WRITE(*,10)
  10 FORMAT('hello, world')
  END PROGRAM HELLOWORLD
  將文件保存‘hello.f’,用 GCC 的 Fortran 前端編譯運行該文件
  $ gfortran -Wall hello.f -o hello
  $ ./hello
  hello, world
  我們已經知道,直接用 gcc 來編譯 C++ 時,需要鏈接 C++ 標準庫,那麼用 gcc 編譯 Fortran時,命令該怎麼寫呢?
  $ gcc -Wall hello.f -o helloworld -lgfortran -lgfortranbegin
  注意:上面這條命令與 gfortran 前端是等價的(g77 與此稍有不同)。其中庫文件 libgfortranbegin.a (通過命令行選項 -lgfortranbegin 被調用) 包含運行和終止一個 Fortran 程序所必須的開始和退出代碼。庫文件 libgfortran.a 包含 Fortran 底層的輸入輸出等所需要的運行函數。
  對於 g77 來說,下面兩條命令是等價的(注意到 g77 對應的 gcc 是 4.0 之前的版本):
  $ g77 -Wall hello.f -o hello
  $ gcc-3.4 -Wall hello.f -o hello -lfrtbegin -lg2c
  命令行中的兩個庫文件分別包含 Fortran 的開始和退出代碼以及 Fortran 底層的運行函數。
  gcc
  也被稱爲高層次的簡稱
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章