C++編譯原理 資料

      首先是預編譯,這一步可以粗略的認爲只做了一件事情,那就是“宏展開”,也就是對那些#***的命令的一種展開。

      例如define MAX 1000就是建立起MAX和1000之間的對等關係,好在編譯階段進行替換。

      例如ifdef/ifndef就是從一個文件中有選擇性的挑出一些符合條件的代碼來交給下一步的編譯階段來處理。這裏面最複雜的莫過於include了,其實也很簡單,就是相當於把那個對應的文件裏面的內容一下子替換到這條include***語句的地方來。

      其次是編譯,這一步很重要,編譯是以一個個獨立的文件作爲單元的,一個文件就會編譯出一個目標文件。(這裏插入一點關於編譯的文件的說明,編譯器通過後綴名來辨識是否編譯該文件,因此“.h”的頭文件一概不理會,而“.cpp”的源文件一律都要被編譯,我實驗過把.h文件的後綴名改爲.cpp,然後在include的地方相應的改爲***.cpp,這樣一來,編譯器就會編譯許多不必要的頭文件,只不過頭文件裏我們通常只放置聲明而不是定義,因此最後鏈接生成的可執行文件的大小是不會改變的)

 

      清楚編譯是以一個個單獨的文件爲單元的,這一點很重要,因此編譯只負責本單元的那些事,而對外部的事情一概不理會,在這一步裏,我們可以調用一個函數而不必給出這個函數的定義,但是要在調用前得到這個函數的聲明(其實這就是include的本質,不就是爲了給你提前提供個聲明而好讓你使用嗎?至於那個函數到底是如何實現的,需要在鏈接這一步裏去找函數的入口地址。因此提供聲明的方式可以是用include把放在別的文件中的聲明拿過來,也可以是在調用之前自己寫一句void max(int,int);都行。),編譯階段剩下的事情就是分析語法的正確性之類的工作了。好啦,總結一下,可以粗略的認爲編譯階段分兩步:    

        第一步,檢驗函數或者變量是否存在它們的聲明;

        第二步,檢查語句是否符合C++語法。

 

最後一步是鏈接,它會把所有編譯好的單元全部鏈接爲一個整體文件,其實這一步可以比作一個“連線”的過程,比如A文件用了B文件中的函數,那麼鏈接的這一步會建立起這個關聯。鏈接時最重要的我認爲是檢查全局空間裏面是不是有重複定義或者缺失定義。這也就解釋了爲什麼我們一般不在頭文件中出現定義,因爲頭文件有可能被釋放到多個源文件中,每個源文件都會單獨編譯,鏈接時就會發現全局空間中有多個定義了。

 

 

 

 

標準C和C++將編譯過程定義爲9個階段(Phases of Translation):

 

1.字符映射(Character Mapping)

    文件中的物理源字符被映射到源字符集中,其中包括三字符運算符的替換、控制字符(行尾的回車換行)的替換。許多非美式鍵盤不支持基本源字符集中的一些字符,文件中可用三字符來代替這些基本源字符,以??爲前導。但如果所用鍵盤是美式鍵盤,有些編譯器可能不對三字符進行查找和替換,需要增加-trigraphs編譯參數。在C++程序中,任何不在基本源字符集中的字符都被它的通用字符名替換。

 

2.行合併(Line Splicing)

    以反斜槓/結束的行和它接下來的行合併。

 

3.標記化(Tokenization)

    每一條註釋被一個單獨的空字符所替換。C++雙字符運算符被識別爲標記(爲了開發可讀性更強的程序,C++爲非ASCII碼開發者定義了一套雙字符運算符集和新的保留字集)。源代碼被分析成預處理標記。

 

4.預處理(Preprocessing)

    調用預處理指令並擴展宏。使用#include指令包含的文件,重複步驟1到4。上述四個階段統稱爲預處理階段。

 

5.字符集映射(Character-set Mapping)

    源字符集成員、轉義序列被轉換成等價的執行字符集成員。例如:'/a'在ASCII環境下會被轉換成值爲一個字節,值爲7。

 

6.字符串連接(String Concatenation)

    相鄰的字符串被連接。例如:"""hahaha""huohuohuo"將成爲"hahahahuohuohuo"。

 

7.翻譯(Translation)

    進行語法和語義分析編譯,並翻譯成目標代碼。

 

8.處理模板

    處理模板實例。

 

9.連接(Linkage)

    解決外部引用的問題,準備好程序映像以便執行。

發佈了42 篇原創文章 · 獲贊 7 · 訪問量 14萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章