高質量C++/C編程指南之C++函數的高級特性

C++函數的高級特性

對比於C語言的函數，C++增加了重載（overloaded）、內聯（inline）、const和virtual四種新機制。其中重載和內聯機制既可用於全局函數也可用於類的成員函數，const與virtual機制僅用於類的成員函數。

重載和內聯肯定有其好處纔會被C++語言採納，但是不可以當成免費的午餐而濫用。本章將探究重載和內聯的優點與侷限性，說明什麼情況下應該採用、不該採用以及要警惕錯用。

8.1 函數重載的概念

8.1.1 重載的起源

自然語言中，一個詞可以有許多不同的含義，即該詞被重載了。人們可以通過上下文來判斷該詞到底是哪種含義。“詞的重載”可以使語言更加簡練。例如“吃飯”的含義十分廣泛，人們沒有必要每次非得說清楚具體吃什麼不可。別迂腐得象孔已己，說茴香豆的茴字有四種寫法。

在C++程序中，可以將語義、功能相似的幾個函數用同一個名字表示，即函數重載。這樣便於記憶，提高了函數的易用性，這是C++語言採用重載機制的一個理由。例如示例8-1-1中的函數EatBeef,EatFish,EatChicken可以用同一個函數名Eat表示，用不同類型的參數加以區別。

void EatBeef(…); // 可以改爲 void Eat(Beef …);

void EatFish(…); // 可以改爲 void Eat(Fish …);

void EatChicken(…); // 可以改爲 void Eat(Chicken …);

示例8-1-1 重載函數Eat

C++語言採用重載機制的另一個理由是：類的構造函數需要重載機制。因爲C++規定構造函數與類同名（請參見第9章），構造函數只能有一個名字。如果想用幾種不同的方法創建對象該怎麼辦？別無選擇，只能用重載機制來實現。所以類可以有多個同名的構造函數。

8.1.2 重載是如何實現的？

幾個同名的重載函數仍然是不同的函數，它們是如何區分的呢？我們自然想到函數接口的兩個要素：參數與返回值。

如果同名函數的參數不同（包括類型、順序不同），那麼容易區別出它們是不同的函數。

如果同名函數僅僅是返回值類型不同，有時可以區分，有時卻不能。例如：

void Function(void);

int Function (void);

上述兩個函數，第一個沒有返回值，第二個的返回值是int類型。如果這樣調用函數：

int x = Function ();

則可以判斷出Function是第二個函數。問題是在C++/C程序中，我們可以忽略函數的返回值。在這種情況下，編譯器和程序員都不知道哪個Function函數被調用。

所以只能靠參數而不能靠返回值類型的不同來區分重載函數。編譯器根據參數爲每個重載函數產生不同的內部標識符。例如編譯器爲示例8-1-1中的三個Eat函數產生象_eat_beef、_eat_fish、_eat_chicken之類的內部標識符（不同的編譯器可能產生不同風格的內部標識符）。

如果C++程序要調用已經被編譯後的C函數，該怎麼辦？

假設某個C函數的聲明如下：

void foo(int x, int y);

該函數被C編譯器編譯後在庫中的名字爲_foo，而C++編譯器則會產生像_foo_int_int之類的名字用來支持函數重載和類型安全連接。由於編譯後的名字不同，C++程序不能直接調用C函數。C++提供了一個C連接交換指定符號extern“C”來解決這個問題。例如：

extern “C”

{

void foo(int x, int y);

… // 其它函數

}

或者寫成

extern “C”

{

#include “myheader.h”

… // 其它C頭文件

}

這就告訴C++編譯譯器，函數foo是個C連接，應該到庫中找名字_foo而不是找_foo_int_int。C++編譯器開發商已經對C標準庫的頭文件作了extern“C”處理，所以我們可以用＃include 直接引用這些頭文件。

注意並不是兩個函數的名字相同就能構成重載。全局函數和類的成員函數同名不算重載，因爲函數的作用域不同。例如：

void Print(…); // 全局函數

class A

{…

void Print(…); // 成員函數

}

不論兩個Print函數的參數是否不同，如果類的某個成員函數要調用全局函數Print，爲了與成員函數Print區別，全局函數被調用時應加‘::’標誌。如

::Print(…); // 表示Print是全局函數而非成員函數

8.1.3 當心隱式類型轉換導致重載函數產生二義性

示例8-1-3中，第一個output函數的參數是int類型，第二個output函數的參數是float類型。由於數字本身沒有類型，將數字當作參數時將自動進行類型轉換（稱爲隱式類型轉換）。語句output(0.5)將產生編譯錯誤，因爲編譯器不知道該將0.5轉換成int還是float類型的參數。隱式類型轉換在很多地方可以簡化程序的書寫，但是也可能留下隱患。

# include <iostream.h>

void output( int x); // 函數聲明

void output( float x); // 函數聲明

void output( int x)

{

cout << " output int " << x << endl ;

}

void output( float x)

{

cout << " output float " << x << endl ;

}

void main(void)

{

int x = 1;

float y = 1.0;

output(x); // output int 1

output(y); // output float 1

output(1); // output int 1

// output(0.5); // error! ambiguous call, 因爲自動類型轉換

output(int(0.5)); // output int 0

output(float(0.5)); // output float 0.5

}

示例8-1-3 隱式類型轉換導致重載函數產生二義性

8.2 成員函數的重載、覆蓋與隱藏

成員函數的重載、覆蓋（override）與隱藏很容易混淆，C++程序員必須要搞清楚概念，否則錯誤將防不勝防。

8.2.1 重載與覆蓋

成員函數被重載的特徵：

（1）相同的範圍（在同一個類中）；

（2）函數名字相同；

（3）參數不同；

（4）virtual關鍵字可有可無。

覆蓋是指派生類函數覆蓋基類函數，特徵是：

（1）不同的範圍（分別位於派生類與基類）；

（2）函數名字相同；

（3）參數相同；

（4）基類函數必須有virtual關鍵字。

示例8-2-1中，函數Base::f(int)與Base::f(float)相互重載，而Base::g(void)被Derived::g(void)覆蓋。

#include <iostream.h>

class Base

{

public:

void f(int x){ cout << "Base::f(int) " << x << endl; }

void f(float x){ cout << "Base::f(float) " << x << endl; }

virtual void g(void){ cout << "Base::g(void)" << endl;}

};

class Derived : public Base

{

public:

virtual void g(void){ cout << "Derived::g(void)" << endl;}

};

void main(void)

{

Derived d;

Base *pb = &d;

pb->f(42); // Base::f(int) 42

pb->f(3.14f); // Base::f(float) 3.14

pb->g(); // Derived::g(void)

}

示例8-2-1成員函數的重載和覆蓋

8.2.2 令人迷惑的隱藏規則

本來僅僅區別重載與覆蓋並不算困難，但是C++的隱藏規則使問題複雜性陡然增加。這裏“隱藏”是指派生類的函數屏蔽了與其同名的基類函數，規則如下：

（1）如果派生類的函數與基類的函數同名，但是參數不同。此時，不論有無virtual關鍵字，基類的函數將被隱藏（注意別與重載混淆）。

（2）如果派生類的函數與基類的函數同名，並且參數也相同，但是基類函數沒有virtual關鍵字。此時，基類的函數被隱藏（注意別與覆蓋混淆）。

示例程序8-2-2（a）中：

（1）函數Derived::f(float)覆蓋了Base::f(float)。

（2）函數Derived::g(int)隱藏了Base::g(float)，而不是重載。

（3）函數Derived::h(float)隱藏了Base::h(float)，而不是覆蓋。

#include <iostream.h>

class Base

{

public:

virtual void f(float x){ cout << "Base::f(float) " << x << endl; }

void g(float x){ cout << "Base::g(float) " << x << endl; }

void h(float x){ cout << "Base::h(float) " << x << endl; }

};

class Derived : public Base

{

public:

virtual void f(float x){ cout << "Derived::f(float) " << x << endl; }

void g(int x){ cout << "Derived::g(int) " << x << endl; }

void h(float x){ cout << "Derived::h(float) " << x << endl; }

};

示例8-2-2（a）成員函數的重載、覆蓋和隱藏

據作者考察，很多C++程序員沒有意識到有“隱藏”這回事。由於認識不夠深刻，“隱藏”的發生可謂神出鬼沒，常常產生令人迷惑的結果。

示例8-2-2（b）中，bp和dp指向同一地址，按理說運行結果應該是相同的，可事實並非這樣。

void main(void)

{

Derived d;

Base *pb = &d;

Derived *pd = &d;

// Good : behavior depends solely on type of the object

pb->f(3.14f); // Derived::f(float) 3.14

pd->f(3.14f); // Derived::f(float) 3.14

// Bad : behavior depends on type of the pointer

pb->g(3.14f); // Base::g(float) 3.14

pd->g(3.14f); // Derived::g(int) 3 (surprise!)

// Bad : behavior depends on type of the pointer

pb->h(3.14f); // Base::h(float) 3.14 (surprise!)

pd->h(3.14f); // Derived::h(float) 3.14

}

示例8-2-2（b）重載、覆蓋和隱藏的比較

8.2.3 擺脫隱藏

隱藏規則引起了不少麻煩。示例8-2-3程序中，語句pd->f(10)的本意是想調用函數Base::f(int)，但是Base::f(int)不幸被Derived::f(char *)隱藏了。由於數字10不能被隱式地轉化爲字符串，所以在編譯時出錯。

class Base

{

public:

void f(int x);

};

class Derived : public Base

{

public:

void f(char *str);

};

void Test(void)

{

Derived *pd = new Derived;

pd->f(10); // error

}

示例8-2-3 由於隱藏而導致錯誤

從示例8-2-3看來，隱藏規則似乎很愚蠢。但是隱藏規則至少有兩個存在的理由：

u 寫語句pd->f(10)的人可能真的想調用Derived::f(char *)函數，只是他誤將參數寫錯了。有了隱藏規則，編譯器就可以明確指出錯誤，這未必不是好事。否則，編譯器會靜悄悄地將錯就錯，程序員將很難發現這個錯誤，流下禍根。

u 假如類Derived有多個基類（多重繼承），有時搞不清楚哪些基類定義了函數f。如果沒有隱藏規則，那麼pd->f(10)可能會調用一個出乎意料的基類函數f。儘管隱藏規則看起來不怎麼有道理，但它的確能消滅這些意外。

示例8-2-3中，如果語句pd->f(10)一定要調用函數Base::f(int)，那麼將類Derived修改爲如下即可。

class Derived : public Base

{

public:

void f(char *str);

void f(int x) { Base::f(x); }

};

8.3 參數的缺省值

有一些參數的值在每次函數調用時都相同，書寫這樣的語句會使人厭煩。C++語言採用參數的缺省值使書寫變得簡潔（在編譯時，缺省值由編譯器自動插入）。

參數缺省值的使用規則：

l 【規則8-3-1】參數缺省值只能出現在函數的聲明中，而不能出現在定義體中。

例如：

void Foo(int x=0, int y=0); // 正確，缺省值出現在函數的聲明中

void Foo(int x=0, int y=0) // 錯誤，缺省值出現在函數的定義體中

{

…

}

爲什麼會這樣？我想是有兩個原因：一是函數的實現（定義）本來就與參數是否有缺省值無關，所以沒有必要讓缺省值出現在函數的定義體中。二是參數的缺省值可能會改動，顯然修改函數的聲明比修改函數的定義要方便。

l 【規則8-3-2】如果函數有多個參數，參數只能從後向前挨個兒缺省，否則將導致函數調用語句怪模怪樣。

正確的示例如下：

void Foo(int x, int y=0, int z=0);

錯誤的示例如下：

void Foo(int x=0, int y, intz=0);

要注意，使用參數的缺省值並沒有賦予函數新的功能，僅僅是使書寫變得簡潔一些。它可能會提高函數的易用性，但是也可能會降低函數的可理解性。所以我們只能適當地使用參數的缺省值，要防止使用不當產生負面效果。示例8-3-2中，不合理地使用參數的缺省值將導致重載函數output產生二義性。

#include <iostream.h>

void output( int x);

void output( int x, float y=0.0);

void output( int x)

{

cout << " output int " << x << endl ;

}

void output( int x, float y)

{

cout << " output int " << x << " and float " << y << endl ;

}

void main(void)

{

int x=1;

float y=0.5;

// output(x); // error! ambiguous call

output(x,y); // output int 1 and float 0.5

}

示例8-3-2 參數的缺省值將導致重載函數產生二義性

8.4 運算符重載

8.4.1 概念

在C++語言中，可以用關鍵字operator加上運算符來表示函數，叫做運算符重載。例如兩個複數相加函數：

Complex Add(const Complex &a, const Complex &b);

可以用運算符重載來表示：

Complex operator +(const Complex &a, const Complex &b);

運算符與普通函數在調用時的不同之處是：對於普通函數，參數出現在圓括號內；而對於運算符，參數出現在其左、右側。例如

Complex a, b, c;

…

c = Add(a, b); // 用普通函數

c = a + b; // 用運算符 +

如果運算符被重載爲全局函數，那麼只有一個參數的運算符叫做一元運算符，有兩個參數的運算符叫做二元運算符。

如果運算符被重載爲類的成員函數，那麼一元運算符沒有參數，二元運算符只有一個右側參數，因爲對象自己成了左側參數。

從語法上講，運算符既可以定義爲全局函數，也可以定義爲成員函數。文獻[Murray , p44-p47]對此問題作了較多的闡述，並總結了表8-4-1的規則。

運算符	規則
所有的一元運算符	建議重載爲成員函數
= () [] ->	只能重載爲成員函數
+= -= /= *= &= \|= ~= %= >>= <<=	建議重載爲成員函數
所有其它運算符	建議重載爲全局函數

表8-4-1 運算符的重載規則

由於C++語言支持函數重載，才能將運算符當成函數來用，C語言就不行。我們要以平常心來對待運算符重載：

（1）不要過分擔心自己不會用，它的本質仍然是程序員們熟悉的函數。

（2）不要過分熱心地使用，如果它不能使代碼變得更加易讀易寫，那就別用，否則會自找麻煩。

8.4.2 不能被重載的運算符

在C++運算符集合中，有一些運算符是不允許被重載的。這種限制是出於安全方面的考慮，可防止錯誤和混亂。

（1）不能改變C++內部數據類型（如int,float等）的運算符。

（2）不能重載‘.’，因爲‘.’在類中對任何成員都有意義，已經成爲標準用法。

（3）不能重載目前C++運算符集合中沒有的符號，如#,@,$等。原因有兩點，一是難以理解，二是難以確定優先級。

（4）對已經存在的運算符進行重載時，不能改變優先級規則，否則將引起混亂。

8.5 函數內聯

8.5.1 用內聯取代宏代碼

C++ 語言支持函數內聯，其目的是爲了提高函數的執行效率（速度）。

在C程序中，可以用宏代碼提高執行效率。宏代碼本身不是函數，但使用起來象函數。預處理器用複製宏代碼的方式代替函數調用，省去了參數壓棧、生成彙編語言的CALL調用、返回參數、執行return等過程，從而提高了速度。使用宏代碼最大的缺點是容易出錯，預處理器在複製宏代碼時常常產生意想不到的邊際效應。例如

#define MAX(a, b) (a) > (b) ? (a) : (b)

語句

result = MAX(i, j) + 2 ;

將被預處理器解釋爲

result = (i) > (j) ? (i) : (j) + 2 ;

由於運算符‘+’比運算符‘:’的優先級高，所以上述語句並不等價於期望的

result = ( (i) > (j) ? (i) : (j) ) + 2 ;

如果把宏代碼改寫爲

#define MAX(a,b) ( (a) > (b) ? (a) : (b) )

則可以解決由優先級引起的錯誤。但是即使使用修改後的宏代碼也不是萬無一失的，例如語句

result = MAX(i++, j);

將被預處理器解釋爲

result = (i++) > (j) ? (i++) : (j);

對於C++ 而言，使用宏代碼還有另一種缺點：無法操作類的私有數據成員。

讓我們看看C++ 的“函數內聯”是如何工作的。對於任何內聯函數，編譯器在符號表裏放入函數的聲明（包括名字、參數類型、返回值類型）。如果編譯器沒有發現內聯函數存在錯誤，那麼該函數的代碼也被放入符號表裏。在調用一個內聯函數時，編譯器首先檢查調用是否正確（進行類型安全檢查，或者進行自動類型轉換，當然對所有的函數都一樣）。如果正確，內聯函數的代碼就會直接替換函數調用，於是省去了函數調用的開銷。這個過程與預處理有顯著的不同，因爲預處理器不能進行類型安全檢查，或者進行自動類型轉換。假如內聯函數是成員函數，對象的地址（this）會被放在合適的地方，這也是預處理器辦不到的。

C++ 語言的函數內聯機制既具備宏代碼的效率，又增加了安全性，而且可以自由操作類的數據成員。所以在C++ 程序中，應該用內聯函數取代所有宏代碼，“斷言assert”恐怕是唯一的例外。assert是僅在Debug版本起作用的宏，它用於檢查“不應該”發生的情況。爲了不在程序的Debug版本和Release版本引起差別，assert不應該產生任何副作用。如果assert是函數，由於函數調用會引起內存、代碼的變動，那麼將導致Debug版本與Release版本存在差異。所以assert不是函數，而是宏。（參見6.5節“使用斷言”）

8.5.2 內聯函數的編程風格

關鍵字inline必須與函數定義體放在一起才能使函數成爲內聯，僅將inline放在函數聲明前面不起任何作用。如下風格的函數Foo不能成爲內聯函數：

inline void Foo(int x, int y); // inline僅與函數聲明放在一起

void Foo(int x, int y)

{

…

}

而如下風格的函數Foo則成爲內聯函數：

void Foo(int x, int y);

inline void Foo(int x, int y) // inline與函數定義體放在一起

{

…

}

所以說，inline是一種“用於實現的關鍵字”，而不是一種“用於聲明的關鍵字”。一般地，用戶可以閱讀函數的聲明，但是看不到函數的定義。儘管在大多數教科書中內聯函數的聲明、定義體前面都加了inline關鍵字，但我認爲inline不應該出現在函數的聲明中。這個細節雖然不會影響函數的功能，但是體現了高質量C++/C程序設計風格的一個基本原則：聲明與定義不可混爲一談，用戶沒有必要、也不應該知道函數是否需要內聯。

定義在類聲明之中的成員函數將自動地成爲內聯函數，例如

class A

{

public:

void Foo(int x, int y) { … } // 自動地成爲內聯函數

}

將成員函數的定義體放在類聲明之中雖然能帶來書寫上的方便，但不是一種良好的編程風格，上例應該改成：

// 頭文件

class A

{

public:

void Foo(int x, int y)；

}

// 定義文件

inline void A::Foo(int x, int y)

{

…

}

8.5.3 慎用內聯

內聯能提高函數的執行效率，爲什麼不把所有的函數都定義成內聯函數？

如果所有的函數都是內聯函數，還用得着“內聯”這個關鍵字嗎？

內聯是以代碼膨脹（複製）爲代價，僅僅省去了函數調用的開銷，從而提高函數的執行效率。如果執行函數體內代碼的時間，相比於函數調用的開銷較大，那麼效率的收穫會很少。另一方面，每一處內聯函數的調用都要複製代碼，將使程序的總代碼量增大，消耗更多的內存空間。以下情況不宜使用內聯：

（1）如果函數體內的代碼比較長，使用內聯將導致內存消耗代價較高。

（2）如果函數體內出現循環，那麼執行函數體內代碼的時間要比函數調用的開銷大。

類的構造函數和析構函數容易讓人誤解成使用內聯更有效。要當心構造函數和析構函數可能會隱藏一些行爲，如“偷偷地”執行了基類或成員對象的構造函數和析構函數。所以不要隨便地將構造函數和析構函數的定義體放在類聲明中。

一個好的編譯器將會根據函數的定義體，自動地取消不值得的內聯（這進一步說明了inline不應該出現在函數的聲明中）。

8.6 一些心得體會

C++ 語言中的重載、內聯、缺省參數、隱式轉換等機制展現了很多優點，但是這些優點的背後都隱藏着一些隱患。正如人們的飲食，少食和暴食都不可取，應當恰到好處。我們要辨證地看待C++的新機制，應該恰如其分地使用它們。雖然這會使我們編程時多費一些心思，少了一些痛快，但這纔是編程的藝術。

高質量C++/C編程指南之C++函數的高級特性

linux下SPI驅動開發

Linux核心之內存管理

Linux 核心之硬件基礎

linu核心之軟件基礎

Linux內核之進程間通訊

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結