騰訊筆試題總結--C程序編譯過程

一、預編譯處理(cpp)
它主要包括四個過程
1.宏定義指令,如#define N 6,#undef等。

        對於前一個僞指令,預編譯所要做的是將程序中的所有N用6替換,請大家注意這裏是替換,並不是像作爲函數參數那樣將6複製進N這個變量。對於後者,則將取消對某個宏的定義,使以後出現的N不再被替換。


2.條件編譯指令,如#ifdef,#ifndef,#endif等。
        這些僞指令的引入使得程序員可以通過定義不同的宏來決定編譯程序對哪些代碼進行處理。預編譯程序將根據有關的文件,將那些不必要的代碼過濾掉。這樣就能在編譯階段減少編譯時間,提高效率,看看這是多好的指令。O(∩_∩)O~
  

3.頭文件包含指令,如#include "file.h"或#include <file.h>等。
        在頭文件中一般用僞指令#define定義了大量的宏(最常見的是字符常量),同時包含有各種外部符號的聲明。
        採用這樣的做法一來可以讓我們直接調用一些複雜庫函數;二來可以免去我們在寫程序時重複做一些定義聲明工作的麻煩。試想一下,一旦我們寫好頭文件,那麼以後要用到相關模塊就再也不用寫這些函數了,直接#include 就OK了,這可是一勞永逸啊,天大的便宜呢,呵呵。
    這裏順便提一下#include<>與#include“”的區別。
         #include<>:這條指令就是告訴編譯器去系統默認的路徑尋找相關文件。
         #include”” :這條是告訴編譯器先去源程序所在目錄下尋找,如果沒有就去系統默認路徑尋找。

4.特殊符號,預編譯程序可以識別一些特殊的符號。
         例如在源程序中出現的LINE標識將被解釋爲當前行號(十進制數),FILE則被解釋爲當前被編譯的C源程序的名稱。預編譯程序就是對在源程序中出現的這些特殊符號將用合適的值進行替換。
    預編譯階段基本上是完成對源程序的相關代碼進行替換,這樣之後程序的原意沒有改變,就是代碼的內容有所不同,這樣爲以後的編譯做好準備
    通常使用以下命令來進行預處理:

        gcc -E hello.c -o hello.i


二、編譯、優化程序(gcc/g++)

    編譯過程就是把預處理完的文件進行一系列的詞法分析,語法分析,語義分析及優化後生成相應的彙編代碼。
        $gcc –S hello.i –o hello.s
    注:現在版本的GCC把預處理和編譯兩個步驟合成一個步驟,用cc1工具來完成。gcc其實是後臺程序的一些包裝,根據不同參數去調用其他的實際處理程序,比如:預編譯編譯程序cc1、彙編器as、連接器ld
      .section    .note.GNU-stack,"",@progbits       </span>  

三、彙編程序(as)
    在這個階段是將彙編代碼翻譯成目標文件,這時的文件已經是二進制代碼了。在windows環境下文件的後綴名是.obj;而在unix下則有是o、.a、.ko等文件。
    目標文件由段組成。通常一個目標文件中至少有兩個段:
        代碼段:該段中所包含的主要是程序的指令。該段一般是可讀和可執行的,但一般卻不可寫。
        數據段:主要存放程序中要用到的各種全局變量或靜態的數據。一般數據段都是可讀,可寫,可執行的。
    通常使用以下命令來進行彙編:
gcc –c hello.c –o hello.o


四、鏈接程序(ld)

     也許有人會有疑問,上面的目標代碼已經是機器碼了,也就是說CPU可以識別這些文件了,那爲什麼我們還要鏈接程序呢?對!那些被包含的頭文件,以及當我們的程序分佈於很多源文件時,那麼這些源文件該怎麼處理呢,這就是連接器的作用,它們被翻譯成目標代碼後需要被鏈接到一起才能被執行。這樣就ok了!
    談到函數庫的鏈接,我們還需要了解點函數庫的知識,函數庫分靜態鏈接庫(又稱靜態庫*.lib)和鏈接動態庫(又稱動態庫*.dll)。

    靜態庫的鏈接在編譯時會被編譯進彙編文件,這樣的操作會改變文件大小;而動態庫則是在執行時(雙擊運行),當需要動態庫中的文件時才被鏈接到可執行文件的。



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章