被誤解的C++——模板和宏

這是我在大家論壇看到的一篇文章,覺得很有那個就收藏了,原文地址http://club.topsage.com/thread-2225504-1-1.html

模板和宏
前些日子,論壇裏大打口水仗的時候,有人提出這樣一個論斷:模板本質上是宏。於是,諸位高手爲此好好辯論了一番。我原本也想加入論戰,但是覺得衆人的言論已經覆蓋了我的想法,所以也就作罷了。
儘管沒有參與討論,但“模板究竟和宏有什麼關係”這個問題,始終在我的腦海中上下翻飛。每當我能夠放鬆下來的時候,這個問題便悄悄地浮現。(通常都是哄兒子睡下,然後舒舒服服地衝個熱水澡的時候:))。
我思索了半天,決定做些實際的代碼,以瞭解兩者的差異。現在,我把試驗的結果提交給大家,讓衆人來評判。
模板和宏是完全兩個東西,這一點毋庸置疑。模板的一些功能,宏沒有;宏的一些功能,模板沒有。不可能誰是誰的影子。我們這裏主要想要弄清的是,模板的本質究竟是不是宏。
需要明確一下,所謂“本質”的含義。這裏我假定:一樣東西是另一樣東西的“本質”,有麼後者是前者的子集,要麼後者是通過前者直接或間接地實現的,要麼後者的基礎原理依賴於前者。如果哪位對此設定心存疑議,那麼我們就得另行討論了。
首先,我編寫了一個模板,然後試圖編寫一個宏來實現這個模板的功能:
template<typename T>
class cls_tmpl
{
public:
string f1() {
strings=v.f()+”1000”;
return s;
}
void f2() {
v.g();
}
private:
Tv;
};
下面是宏的模擬:
#definecls_mcr(T) \
class \
{\
public:\
void f1() {\
v.f();\
}\
void f2() {\
v.g();\
}\
private:\
Tv;\
}
當我使用模板時,需要這麼寫:
cls_tmpl<Tp1>ct;
使用宏的版本,這麼寫:
cls_mcr(Tp1)cm;
兩者寫法一樣。但是下列代碼便出現問題:
cls_tmpl<Tp1>ct1;
cls_tmpl<Tp1>ct2;
ct1=ct2;//Ok,ct1和ct2是同樣的類型
cls_mcr(Tp1)cm1;
cls_mcr(Tp1)cm2;
cm1=cm2;//編譯錯誤,cm1和cm2的類型不同
由於cls_mcr(Tp1)兩次展開時,各自定義了一遍類,編譯器會認爲他們是兩個不同的類型。但模板無論實例化多少次,只要類型實參相同,就是同一個類型。
這些便說明,模板和宏具備完全不同的語義,不可能用宏直接實現模板。如果要使宏避開這些問題,必須採用兩階段方式操作:
typedef cls_mcr(Tp1)cls_mcr_Tp1_;
cls_mcr_Tp1_cm1;
cls_mcr_Tp1_cm2;
cm1=cm2;//同一個類型,可以賦值
這反倒給了我們一個提示,或許編譯器可以在一個“草稿本”上把宏展開,然後通過用展開後的類名將所有用到的cls_mcr(…)替換掉。這樣便實現了模板。
但事情並沒有那麼簡單。請考慮以下代碼:
class Tp1
{
public:
string f() {
return“X”;
}
};

cls_tmpl<Tp1>ct1;
ct1.f1();

cls_mcr(Tp1)cm1;//編譯錯誤:Tp1不包含成員函數g()
cm1.f1();
儘管模板和宏的代碼一樣,但是編譯器卻給出了不同的結果。回溯到cls_tmpl和cls_mcr的定義,兩者都有一個f2()成員函數訪問了Tp1的成員函數g()。但是,模板的代碼並沒有給出任何錯誤,而宏卻有編譯錯誤。要解釋清楚這個差異,先得了解一下C++模板的一個特殊的機制:模板中的代碼只有在用到時纔會被實例化。也就是說,當遇到cls_tmpl<Tp1>時,編譯器並不會完全展開整個模板類。只有當訪問了模板上的某個成員函數時,纔會將成員函數的代碼展開作語義檢查。所以,當我僅僅調用f1()時,不會引發編譯錯誤。只有在調用f2()時,纔會有編譯錯:
ct1.f2();//編譯錯誤,Tp1不包含成員函數g()
這種機制的目的主要是爲了減少編譯時間。但後來卻成爲了泛型編程和模板元編程中非常重要的一個機制。(最早用於traits等方面,參見《C++ Template》一書。我在模擬屬性的嘗試中,也使用了這種機制,很好用。)
相反,宏是直接將所有的代碼同時展開,之後在編譯過程中執行全面的語言檢查,無論其成員函數使用與否。而模板一開始僅作語法檢查,只有使用到的代碼才做語義檢查和實際編譯。
從這一點看出,即使允許宏在“草稿本”中展開,它同模板在展開方式上也存在着巨大的差別。僅憑這一點,便可以否定“模板的本質是宏”這個論斷。但是,如果我們把眼光放寬一些,是否可以這麼認爲:儘管模板和宏採用了完全不同的展開方式,那麼如果模板中的每個成員都看作獨立的宏,那麼是否可以認爲模板是通過一組宏,而不是一個宏,實現的呢?
讓我們來看模板cls_tmpl<>的成員函數f1():
string f1() {
strings=v.f()+”1000”;
return s;
}
如果我們把f1看作一個宏, f1在需要時以宏的方式展開,然後正式編譯。當然,我們首先必須將模板轉換成一組宏。如果哪個編譯器真是這樣做的,那麼可以勉強地認爲這個編譯器是通過宏實現模板的。(不過這種樣子的“宏”,還能算宏嗎?)
但是,當我們考慮另一個問題,事情就不再那麼簡單了。請看以下代碼:
x=y;
a=b;
假設x、y、a、b都是int類型。這兩行代碼編譯後可能會變成如下等效的彙編代碼(實際上是機器碼):
mov eax, y
mov x, eax
mov eax, b
mov a, eax
我們可以看到,這兩行代碼分別轉化成兩條彙編指令,所不同的是參與的內存變量。可以認爲編譯器把賦值的彙編碼(機器碼)做成一個“宏”:
#define assign(v1, v2) \
mov eax, v2\
mov v1, eax
在編譯時用內存變量(的地址)替換“宏”的參數。那麼這種情況下,我們是否應該認爲編譯器(或者說編譯)的本質是宏呢?
由於C++標準沒有規定用什麼方式展開模板,而我們也很難知道各種編譯器是如何實現模板的,也就無從得知模板是否通過宏物理實現。但是,我個人的看法是,宏和模板都是語法層面的機制。如果一定要用宏這種語法層面的機制,來解釋模板的(物理)本質,那也太牽強附會了。
我覺得比較合理的解釋是:如果一定要把宏和模板扯上什麼“親戚關係”,那麼說宏是模板的遠方大表哥比較合理。兩者在技術上有一定的同源性。都是以標識符替換爲基礎的。但是,其他在方面,我們很難說它們有多大的相似性或者關係。宏是語法層面的機制,而模板則深入到語義層面。無論是語法、語義,還是具體的實現,都沒有什麼一樣的地方。
至於“模板的本質是宏”這種說法的始作俑者,可能是Stroupstrup本人。最初他提出模板(當時稱爲類型參數)可以通過宏實現。但是不久以後,便發現他心目中的模板和宏有着天壤之別。於是,他和其他C++的創建者一起建立和發展了模板的各種機制。
故事本該就此結束,但是這個說法卻越傳越廣。我猜想原因有可能兩種。其一是爲了使一些初學者理解模板的基本特徵,用宏來近似地解釋以下模板,使人容易理解。我曾經對一些不開竅的同僚說:“如果你實在搞不清模板,可以把它理解成象宏那樣的東西。但是記住,它跟宏沒關係!”很多人話只聽半句。他們記住了前半句,扔掉了更重要的後半句。所以,我現在再也不說這樣的話了。
另一種原因可就險惡多了。一些試圖打壓C++的人總是不遺餘力地貶損C++的各種特性,(C++的問題我們得承認,但是總得實事求是吧),特別是那些最強大的功能。而模板則是首當其衝的。如果把模板和宏,這種醜陋的、臭名昭著的“史前活化石”聯繫在一起,對於打擊C++的名聲有莫大的幫助。(即便C++社羣,也非常積極地排斥宏)。
實際上,模板的本質是不是宏,根本沒有什麼實際意義。即便是這樣,也絲毫不會影響模板的價值。很多高級的編程機制都是建立在傳統的技術之上的,比如虛函數就是利用函數指針表和間接調用實現的。從沒有人拿這一點說事。
但是,很多人卻對模板大做文章,想借此說明模板在本質上是落後的東西。以此欺騙世人,特別是那些懵懂的初學者。我寫此文的目的,就是實在忍受不了這種指鹿爲馬的言論,藉此反擊一下。
另一方面,通過模板和宏的特性的比較,可以使我們更深入地瞭解和理解兩種機制的特性、能力和限制。溫故而知新,總會有新的收穫。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章