被誤解的C++——模板和宏

這是我在大家論壇看到的一篇文章，覺得很有那個就收藏了，原文地址http://club.topsage.com/thread-2225504-1-1.html

模板和宏
前些日子，論壇裏大打口水仗的時候，有人提出這樣一個論斷：模板本質上是宏。於是，諸位高手爲此好好辯論了一番。我原本也想加入論戰，但是覺得衆人的言論已經覆蓋了我的想法，所以也就作罷了。
儘管沒有參與討論，但“模板究竟和宏有什麼關係”這個問題，始終在我的腦海中上下翻飛。每當我能夠放鬆下來的時候，這個問題便悄悄地浮現。（通常都是哄兒子睡下，然後舒舒服服地衝個熱水澡的時候:)）。
我思索了半天，決定做些實際的代碼，以瞭解兩者的差異。現在，我把試驗的結果提交給大家，讓衆人來評判。
模板和宏是完全兩個東西，這一點毋庸置疑。模板的一些功能，宏沒有；宏的一些功能，模板沒有。不可能誰是誰的影子。我們這裏主要想要弄清的是，模板的本質究竟是不是宏。
需要明確一下，所謂“本質”的含義。這裏我假定：一樣東西是另一樣東西的“本質”，有麼後者是前者的子集，要麼後者是通過前者直接或間接地實現的，要麼後者的基礎原理依賴於前者。如果哪位對此設定心存疑議，那麼我們就得另行討論了。
首先，我編寫了一個模板，然後試圖編寫一個宏來實現這個模板的功能：
template<typename T>
class cls_tmpl
{
public:
string f1() {
strings=v.f()+”1000”;
return s;
}
void f2() {
v.g();
}
private:
Tv;
};
下面是宏的模擬：
#definecls_mcr(T) \
class \
{\
public:\
void f1() {\
v.f();\
}\
void f2() {\
v.g();\
}\
private:\
Tv;\
}
當我使用模板時，需要這麼寫：
cls_tmpl<Tp1>ct;
使用宏的版本，這麼寫：
cls_mcr(Tp1)cm;
兩者寫法一樣。但是下列代碼便出現問題：
cls_tmpl<Tp1>ct1;
cls_tmpl<Tp1>ct2;
ct1=ct2;//Ok，ct1和ct2是同樣的類型
cls_mcr(Tp1)cm1;
cls_mcr(Tp1)cm2;
cm1=cm2;//編譯錯誤，cm1和cm2的類型不同
由於cls_mcr(Tp1)兩次展開時，各自定義了一遍類，編譯器會認爲他們是兩個不同的類型。但模板無論實例化多少次，只要類型實參相同，就是同一個類型。
這些便說明，模板和宏具備完全不同的語義，不可能用宏直接實現模板。如果要使宏避開這些問題，必須採用兩階段方式操作：
typedef cls_mcr(Tp1)cls_mcr_Tp1_;
cls_mcr_Tp1_cm1;
cls_mcr_Tp1_cm2;
cm1=cm2;//同一個類型，可以賦值
這反倒給了我們一個提示，或許編譯器可以在一個“草稿本”上把宏展開，然後通過用展開後的類名將所有用到的cls_mcr(…)替換掉。這樣便實現了模板。
但事情並沒有那麼簡單。請考慮以下代碼：
class Tp1
{
public:
string f() {
return“X”;
}
};

cls_tmpl<Tp1>ct1;
ct1.f1();

cls_mcr(Tp1)cm1;//編譯錯誤：Tp1不包含成員函數g()
cm1.f1();
儘管模板和宏的代碼一樣，但是編譯器卻給出了不同的結果。回溯到cls_tmpl和cls_mcr的定義，兩者都有一個f2()成員函數訪問了Tp1的成員函數g()。但是，模板的代碼並沒有給出任何錯誤，而宏卻有編譯錯誤。要解釋清楚這個差異，先得了解一下C++模板的一個特殊的機制：模板中的代碼只有在用到時纔會被實例化。也就是說，當遇到cls_tmpl<Tp1>時，編譯器並不會完全展開整個模板類。只有當訪問了模板上的某個成員函數時，纔會將成員函數的代碼展開作語義檢查。所以，當我僅僅調用f1()時，不會引發編譯錯誤。只有在調用f2()時，纔會有編譯錯：
ct1.f2();//編譯錯誤，Tp1不包含成員函數g()
這種機制的目的主要是爲了減少編譯時間。但後來卻成爲了泛型編程和模板元編程中非常重要的一個機制。（最早用於traits等方面，參見《C++ Template》一書。我在模擬屬性的嘗試中，也使用了這種機制，很好用。）
相反，宏是直接將所有的代碼同時展開，之後在編譯過程中執行全面的語言檢查，無論其成員函數使用與否。而模板一開始僅作語法檢查，只有使用到的代碼才做語義檢查和實際編譯。
從這一點看出，即使允許宏在“草稿本”中展開，它同模板在展開方式上也存在着巨大的差別。僅憑這一點，便可以否定“模板的本質是宏”這個論斷。但是，如果我們把眼光放寬一些，是否可以這麼認爲：儘管模板和宏採用了完全不同的展開方式，那麼如果模板中的每個成員都看作獨立的宏，那麼是否可以認爲模板是通過一組宏，而不是一個宏，實現的呢？
讓我們來看模板cls_tmpl<>的成員函數f1()：
string f1() {
strings=v.f()+”1000”;
return s;
}
如果我們把f1看作一個宏， f1在需要時以宏的方式展開，然後正式編譯。當然，我們首先必須將模板轉換成一組宏。如果哪個編譯器真是這樣做的，那麼可以勉強地認爲這個編譯器是通過宏實現模板的。（不過這種樣子的“宏”，還能算宏嗎？）
但是，當我們考慮另一個問題，事情就不再那麼簡單了。請看以下代碼：
x=y;
a=b;
假設x、y、a、b都是int類型。這兩行代碼編譯後可能會變成如下等效的彙編代碼（實際上是機器碼）：
mov eax, y
mov x, eax
mov eax, b
mov a, eax
我們可以看到，這兩行代碼分別轉化成兩條彙編指令，所不同的是參與的內存變量。可以認爲編譯器把賦值的彙編碼（機器碼）做成一個“宏”：
#define assign(v1, v2) \
mov eax, v2\
mov v1, eax
在編譯時用內存變量（的地址）替換“宏”的參數。那麼這種情況下，我們是否應該認爲編譯器（或者說編譯）的本質是宏呢？
由於C++標準沒有規定用什麼方式展開模板，而我們也很難知道各種編譯器是如何實現模板的，也就無從得知模板是否通過宏物理實現。但是，我個人的看法是，宏和模板都是語法層面的機制。如果一定要用宏這種語法層面的機制，來解釋模板的（物理）本質，那也太牽強附會了。
我覺得比較合理的解釋是：如果一定要把宏和模板扯上什麼“親戚關係”，那麼說宏是模板的遠方大表哥比較合理。兩者在技術上有一定的同源性。都是以標識符替換爲基礎的。但是，其他在方面，我們很難說它們有多大的相似性或者關係。宏是語法層面的機制，而模板則深入到語義層面。無論是語法、語義，還是具體的實現，都沒有什麼一樣的地方。
至於“模板的本質是宏”這種說法的始作俑者，可能是Stroupstrup本人。最初他提出模板（當時稱爲類型參數）可以通過宏實現。但是不久以後，便發現他心目中的模板和宏有着天壤之別。於是，他和其他C++的創建者一起建立和發展了模板的各種機制。
故事本該就此結束，但是這個說法卻越傳越廣。我猜想原因有可能兩種。其一是爲了使一些初學者理解模板的基本特徵，用宏來近似地解釋以下模板，使人容易理解。我曾經對一些不開竅的同僚說：“如果你實在搞不清模板，可以把它理解成象宏那樣的東西。但是記住，它跟宏沒關係！”很多人話只聽半句。他們記住了前半句，扔掉了更重要的後半句。所以，我現在再也不說這樣的話了。
另一種原因可就險惡多了。一些試圖打壓C++的人總是不遺餘力地貶損C++的各種特性，（C++的問題我們得承認，但是總得實事求是吧），特別是那些最強大的功能。而模板則是首當其衝的。如果把模板和宏，這種醜陋的、臭名昭著的“史前活化石”聯繫在一起，對於打擊C++的名聲有莫大的幫助。（即便C++社羣，也非常積極地排斥宏）。
實際上，模板的本質是不是宏，根本沒有什麼實際意義。即便是這樣，也絲毫不會影響模板的價值。很多高級的編程機制都是建立在傳統的技術之上的，比如虛函數就是利用函數指針表和間接調用實現的。從沒有人拿這一點說事。
但是，很多人卻對模板大做文章，想借此說明模板在本質上是落後的東西。以此欺騙世人，特別是那些懵懂的初學者。我寫此文的目的，就是實在忍受不了這種指鹿爲馬的言論，藉此反擊一下。
另一方面，通過模板和宏的特性的比較，可以使我們更深入地瞭解和理解兩種機制的特性、能力和限制。溫故而知新，總會有新的收穫。

被誤解的C++——模板和宏

lightdb hash index的性能和限制

被誤解的C++——模板和宏

OpenGL模版測試

用C#自制蘋果工具條Dock

ogre Light，billboard ，Controller

區分glFrustum和gluPerspective

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結