C預編譯 -編譯-執行

C 語言編譯原理簡介
剛開始接觸編程的時候,只知道照書敲敲代碼,一直都不知道在windows 平臺下的程
序代碼經過鼠標那樣點擊幾下,之後程序的結果就會在那個黑色的屏幕上,這期間到底發生
了些什麼。現在找了個機會將C 語言的編譯原理的流程做一下小小的總結,這樣也能爲以
後我們進軍linux 編程做一些準備,現在這裏和大家一起分享分享。O(∩_∩)O~
講到編譯原理,我覺得首先我們得明白一些基本概念。
1.  編輯器:我們編寫代碼的一些窗口,如:記事本、word、notepad  等。
2.  編譯器:檢查用戶代碼的一些語法錯誤並且將其編譯成彙編代碼。
3.  彙編器:將編譯出來的文件變成目標代碼(windows  下的.obj 文件)
4.  連接器:將目標代碼連接成爲可執行文件(.exe),及雙擊就可以運行文件。
5.  集成開發環境(Integrated Development Environment,簡稱IDE):是用於程序開發環
境的應用程序,一般包括代碼編輯器、編譯器、調試器和圖形用戶界面工具。如:VC6.0、
C_Free 等。
好了,下面大家來看看整個過程吧:
 
 
Ok!現在是不是對程序的編譯有一點概念了,O(∩_∩)O~。現在稍微總結一下編譯的完整

過程吧:

      C 源程序-- > 預編譯處理 (.c) -- > 編譯、優化程序( .s 、 .asm )-- > 匯
編程序 (.obj 、 .o 、 .a 、 .ko) -- > 鏈接程序( .exe 、 .elf 、 .axf 等)。 
好了,現在我們就來逐條瞭解一下每個過程吧。
1.  C 源程序 
  這個大家都清楚了,那就是自己編寫程序代碼。 
2.  預編譯處理 (.c)
它主要包括四個過程
a 、宏定義指令,如 #define N 6 , #undef 等。 
  對於前一個僞指令,預編譯所要做的是將程序中的所有N 用6 替換,請大家注意
這裏是替換,並不是像作爲函數參數那樣將 6 複製進 N 這個變量。對於後者,則將取消對
某個宏的定義,使以後出現的N 不再被替換。
  b 、條件編譯指令,如 #ifdef , #ifndef , #endif 等。 
  這些僞指令的引入使得程序員可以通過定義不同的宏來決定編譯程序對哪些代碼
進行處理。預編譯程序將根據有關的文件,將那些不必要的代碼過濾掉。這樣就能在編譯階
段減少編譯時間,提高效率,看看這是多好的指令。O(∩_∩)O~
    c 、   頭文件包含指令,如 #include "file.h" 或 #include <file.h> 等。 
    在頭文件中一般用僞指令#define 定義了大量的宏(最常見的是字符常量),同時
包含有各種外部符號的聲明。
              採用這樣的做法一來可以讓我們直接調用一些複雜庫函數;二來可以免去我們在寫
程序時重複做一些定義聲明工作的麻煩。試想一下,一旦我們寫好頭文件,那麼以後要用到
相關模塊就再也不用寫這些函數了,直接#include  就OK 了,這可是一勞永逸啊,天大的
便宜呢,呵呵。
  對了,這裏順便提一下#include<>與#include“”的區別。
  #include<>:這條指令就是告訴編譯器去系統默認的路徑尋找相關文件。
#include””  :這條是告訴編譯器先去源程序所在目錄下尋找,如果沒有就去系統默
認路徑尋找。
    d 、特殊符號,預編譯程序可以識別一些特殊的符號。 
  例如在源程序中出現的LINE 標識將被解釋爲當前行號(十進制數),FILE 則被解
釋爲當前被編譯的C 源程序的名稱。預編譯程序就是對在源程序中出現的這些特殊符號將
用合適的值進行替換。
      大家注意到沒,預編譯階段基本上是完成對源程序的相關代碼進行替換,這樣之後程序
的原意沒有改變,就是代碼的內容有所不同,這樣爲以後的編譯做好準備,ok,第二階段
完滿結束,嘿嘿!
3.  編譯、優化程序( .s 、 .asm ) 
  經過上一階段的處理,現在我們的程序已經沒有宏定義,包含頭文件等指令了,只
剩下一些變量,常量,關鍵字等,而編譯的主要作用是檢查這些代碼的語法錯誤及將這些代
碼編譯成爲彙編文件。 
 
  優化程序這是很複雜的,不僅和編譯技術本身有關,還和目標板相應的硬件環境有
很大的關係。如下面的代碼:
int a,b,c;  
a = inWord(0x100);   
b = a;  
a = inWord (0x100);   
c = a;
很可能被編譯器優化爲:
int a,b,c;  
a = inWord(0x100);   
b = a;  
c = a;
也正是由於這種編譯器優化作用才使關鍵字volatile 有了這麼大的用武之地,當然這只是原
因之一。
4.  彙編程序 (.obj 、 .o 、 .a 、 .ko)
在這個階段是將彙編代碼翻譯成目標文件,這時的文件已經是二進制代碼了。在
windows 環境下文件的後綴名是.obj;而在unix 下則有是o、.a、.ko 等文件。
目標文件由段組成。通常一個目標文件中至少有兩個段:
          代碼段:該段中所包含的主要是程序的指令。該段一般是可讀和可執行的,但一般卻
不可寫。
     數據段:主要存放程序中要用到的各種全局變量或靜態的數據。一般數據段都是可讀,
可寫,可執行的。
5.  鏈接程序( .exe 、 .elf 、 .axf ) 
也許有人會有疑問,上面的目標代碼已經是機器碼了,也就是說CPU 可以識別這些
文件了,那爲什麼我們還要鏈接程序呢?大家想想我們是不是忘了點什麼。。。對!那些被
包含的頭文件,以及當我們的程序分佈於很多源文件時,那麼這些源文件該怎麼處理呢,這
就是連接器的作用,它們被翻譯成目標代碼後需要被鏈接到一起才能被執行。這樣就ok 了,
嘿嘿!
談到函數庫的鏈接,我們還需要了解點函數庫的知識,函數庫分靜態鏈接庫(又稱靜
態庫*.lib)和鏈接動態庫(又稱動態庫*.dll)。
靜態庫的鏈接在編譯時會被編譯進彙編文件,這樣的操作會改變文件大小;而動態庫
則是在執行時(雙擊運行),當需要動態庫中的文件時才被鏈接到可執行文件的。
  Ok!總結就到這裏吧,當然C 語言的編譯原理遠不止這麼簡單!如果大家有興趣
可以去找相關資料作更深而對研究,到時候也可以和其他人一起分享,我在這裏只是對其流
程作一下簡介,希望對大家能有所幫助吧,O(∩_∩)O~~~~
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章