高質量C++/C編程指南[7]

第7章 內存管理

歡迎進入內存這片雷區。偉大的Bill Gates 曾經失言：

640K ought to be enough for everybody

— Bill Gates 1981

程序員們經常編寫內存管理程序，往往提心吊膽。如果不想觸雷，唯一的解決辦法就是發現所有潛伏的地雷並且排除它們，躲是躲不了的。本章的內容比一般教科書的要深入得多，讀者需細心閱讀，做到真正地通曉內存管理。

7.1內存分配方式

內存分配方式有三種：

（1）從靜態存儲區域分配。內存在程序編譯的時候就已經分配好，這塊內存在程序的整個運行期間都存在。例如全局變量，static變量。

（2）在棧上創建。在執行函數時，函數內局部變量的存儲單元都可以在棧上創建，函數執行結束時這些存儲單元自動被釋放。棧內存分配運算內置於處理器的指令集中，效率很高，但是分配的內存容量有限。

（3）從堆上分配，亦稱動態內存分配。程序在運行的時候用malloc或new申請任意多少的內存，程序員自己負責在何時用free或delete釋放內存。動態內存的生存期由我們決定，使用非常靈活，但問題也最多。

7.2常見的內存錯誤及其對策

發生內存錯誤是件非常麻煩的事情。編譯器不能自動發現這些錯誤，通常是在程序運行時才能捕捉到。而這些錯誤大多沒有明顯的症狀，時隱時現，增加了改錯的難度。有時用戶怒氣衝衝地把你找來，程序卻沒有發生任何問題，你一走，錯誤又發作了。

常見的內存錯誤及其對策如下：

u 內存分配未成功，卻使用了它。

編程新手常犯這種錯誤，因爲他們沒有意識到內存分配會不成功。常用解決辦法是，在使用內存之前檢查指針是否爲NULL。如果指針p是函數的參數，那麼在函數的入口處用assert(p!=NULL)進行檢查。如果是用malloc或new來申請內存，應該用if(p==NULL) 或if(p!=NULL)進行防錯處理。

u 內存分配雖然成功，但是尚未初始化就引用它。

犯這種錯誤主要有兩個起因：一是沒有初始化的觀念；二是誤以爲內存的缺省初值全爲零，導致引用初值錯誤（例如數組）。

內存的缺省初值究竟是什麼並沒有統一的標準，儘管有些時候爲零值，我們寧可信其無不可信其有。所以無論用何種方式創建數組，都別忘了賦初值，即便是賦零值也不可省略，不要嫌麻煩。

u 內存分配成功並且已經初始化，但操作越過了內存的邊界。

例如在使用數組時經常發生下標“多1”或者“少1”的操作。特別是在for循環語句中，循環次數很容易搞錯，導致數組操作越界。

u 忘記了釋放內存，造成內存泄露。

含有這種錯誤的函數每被調用一次就丟失一塊內存。剛開始時系統的內存充足，你看不到錯誤。終有一次程序突然死掉，系統出現提示：內存耗盡。

動態內存的申請與釋放必須配對，程序中malloc與free的使用次數一定要相同，否則肯定有錯誤（new/delete同理）。

u 釋放了內存卻繼續使用它。

有三種情況：

（1）程序中的對象調用關係過於複雜，實在難以搞清楚某個對象究竟是否已經釋放了內存，此時應該重新設計數據結構，從根本上解決對象管理的混亂局面。

（2）函數的return語句寫錯了，注意不要返回指向“棧內存”的“指針”或者“引用”，因爲該內存在函數體結束時被自動銷燬。

（3）使用free或delete釋放了內存後，沒有將指針設置爲NULL。導致產生“野指針”。

l 【規則7-2-1】用malloc或new申請內存之後，應該立即檢查指針值是否爲NULL。防止使用指針值爲NULL的內存。

l 【規則7-2-2】不要忘記爲數組和動態內存賦初值。防止將未被初始化的內存作爲右值使用。

l 【規則7-2-3】避免數組或指針的下標越界，特別要當心發生“多1”或者“少1”操作。

l 【規則7-2-4】動態內存的申請與釋放必須配對，防止內存泄漏。

l 【規則7-2-5】用free或delete釋放了內存之後，立即將指針設置爲NULL，防止產生“野指針”。

7.3指針與數組的對比

C++/C程序中，指針和數組在不少地方可以相互替換着用，讓人產生一種錯覺，以爲兩者是等價的。

數組要麼在靜態存儲區被創建（如全局數組），要麼在棧上被創建。數組名對應着（而不是指向）一塊內存，其地址與容量在生命期內保持不變，只有數組的內容可以改變。

指針可以隨時指向任意類型的內存塊，它的特徵是“可變”，所以我們常用指針來操作動態內存。指針遠比數組靈活，但也更危險。

下面以字符串爲例比較指針與數組的特性。

7.3.1修改內容

示例7-3-1中，字符數組a的容量是6個字符，其內容爲hello/0。a的內容可以改變，如a[0]= ‘X’。指針p指向常量字符串“world”（位於靜態存儲區，內容爲world/0），常量字符串的內容是不可以被修改的。從語法上看，編譯器並不覺得語句p[0]= ‘X’有什麼不妥，但是該語句企圖修改常量字符串的內容而導致運行錯誤。

char a[] = “hello”;

a[0] = ‘X’;

cout << a << endl;

char *p = “world”; // 注意p指向常量字符串

p[0] = ‘X’; // 編譯器不能發現該錯誤

cout << p << endl;

示例7-3-1修改數組和指針的內容

7.3.2內容復制與比較

不能對數組名進行直接復制與比較。示例7-3-2中，若想把數組a的內容複製給數組b，不能用語句 b = a ，否則將產生編譯錯誤。應該用標準庫函數strcpy進行復制。同理，比較b和a的內容是否相同，不能用if(b==a) 來判斷，應該用標準庫函數strcmp進行比較。

語句p = a 並不能把a的內容複製指針p，而是把a的地址賦給了p。要想複製a的內容，可以先用庫函數malloc爲p申請一塊容量爲strlen(a)+1個字符的內存，再用strcpy進行字符串複製。同理，語句if(p==a) 比較的不是內容而是地址，應該用庫函數strcmp來比較。

// 數組…

char a[] = "hello";

char b[10];

strcpy(b, a); // 不能用 b = a;

if(strcmp(b, a) == 0) // 不能用 if (b == a)

…

// 指針…

int len = strlen(a);

char *p = (char *)malloc(sizeof(char)*(len+1));

strcpy(p,a); // 不要用 p = a;

if(strcmp(p, a) == 0) // 不要用 if (p == a)

…

示例7-3-2數組和指針的內容複製與比較

7.3.3計算內存容量

用運算符sizeof可以計算出數組的容量（字節數）。示例7-3-3（a）中，sizeof(a)的值是12（注意別忘了’/0’）。指針p指向a，但是sizeof(p)的值卻是4。這是因爲sizeof(p)得到的是一個指針變量的字節數，相當於sizeof(char*)，而不是p所指的內存容量。C++/C語言沒有辦法知道指針所指的內存容量，除非在申請內存時記住它。

注意當數組作爲函數的參數進行傳遞時，該數組自動退化爲同類型的指針。示例7-3-3（b）中，不論數組a的容量是多少，sizeof(a)始終等於sizeof(char *)。

char a[] = "hello world";

char *p = a;

cout<< sizeof(a) << endl; // 12字節

cout<< sizeof(p) << endl; // 4字節

示例7-3-3（a）計算數組和指針的內存容量

void Func(char a[100])

{

cout<< sizeof(a) << endl; // 4字節而不是100字節

}

示例7-3-3（b）數組退化爲指針

7.4指針參數是如何傳遞內存的？

如果函數的參數是一個指針，不要指望用該指針去申請動態內存。示例7-4-1中，Test函數的語句GetMemory(str, 200)並沒有使str獲得期望的內存，str依舊是NULL，爲什麼？

void GetMemory(char *p, int num)

{

p = (char *)malloc(sizeof(char) * num);

}

void Test(void)

{

char *str = NULL;

GetMemory(str, 100); // str 仍然爲 NULL

strcpy(str, "hello"); // 運行錯誤

}

示例7-4-1試圖用指針參數申請動態內存

毛病出在函數GetMemory中。編譯器總是要爲函數的每個參數製作臨時副本，指針參數p的副本是 _p，編譯器使 _p = p。如果函數體內的程序修改了_p的內容，就導致參數p的內容作相應的修改。這就是指針可以用作輸出參數的原因。在本例中，_p申請了新的內存，只是把_p所指的內存地址改變了，但是p絲毫未變。所以函數GetMemory並不能輸出任何東西。事實上，每執行一次GetMemory就會泄露一塊內存，因爲沒有用free釋放內存。

如果非得要用指針參數去申請內存，那麼應該改用“指向指針的指針”，見示例7-4-2。

void GetMemory2(char **p, int num)

{

*p = (char *)malloc(sizeof(char) * num);

}

void Test2(void)

{

char *str = NULL;

GetMemory2(&str, 100); // 注意參數是 &str，而不是str

strcpy(str, "hello");

cout<< str << endl;

free(str);

}

示例7-4-2用指向指針的指針申請動態內存

由於“指向指針的指針”這個概念不容易理解，我們可以用函數返回值來傳遞動態內存。這種方法更加簡單，見示例7-4-3。

char *GetMemory3(int num)

{

char *p = (char *)malloc(sizeof(char) * num);

return p;

}

void Test3(void)

{

char *str = NULL;

str = GetMemory3(100);

strcpy(str, "hello");

cout<< str << endl;

free(str);

}

示例7-4-3用函數返回值來傳遞動態內存

用函數返回值來傳遞動態內存這種方法雖然好用，但是常常有人把return語句用錯了。這裏強調不要用return語句返回指向“棧內存”的指針，因爲該內存在函數結束時自動消亡，見示例7-4-4。

char *GetString(void)

{

char p[] = "hello world";

return p; // 編譯器將提出警告

}

void Test4(void)

{

char *str = NULL;

str = GetString(); // str 的內容是垃圾

cout<< str << endl;

}

示例7-4-4 return語句返回指向“棧內存”的指針

用調試器逐步跟蹤Test4，發現執行str = GetString語句後str不再是NULL指針，但是str的內容不是“hello world”而是垃圾。

如果把示例7-4-4改寫成示例7-4-5，會怎麼樣？

char *GetString2(void)

{

char *p = "hello world";

return p;

}

void Test5(void)

{

char *str = NULL;

str = GetString2();

cout<< str << endl;

}

示例7-4-5 return語句返回常量字符串

函數Test5運行雖然不會出錯，但是函數GetString2的設計概念卻是錯誤的。因爲GetString2內的“hello world”是常量字符串，位於靜態存儲區，它在程序生命期內恆定不變。無論什麼時候調用GetString2，它返回的始終是同一個“只讀”的內存塊。

7.5 free和delete把指針怎麼啦？

別看free和delete的名字惡狠狠的（尤其是delete），它們只是把指針所指的內存給釋放掉，但並沒有把指針本身幹掉。

用調試器跟蹤示例7-5，發現指針p被free以後其地址仍然不變（非NULL），只是該地址對應的內存是垃圾，p成了“野指針”。如果此時不把p設置爲NULL，會讓人誤以爲p是個合法的指針。

如果程序比較長，我們有時記不住p所指的內存是否已經被釋放，在繼續使用p之前，通常會用語句if (p != NULL)進行防錯處理。很遺憾，此時if語句起不到防錯作用，因爲即便p不是NULL指針，它也不指向合法的內存塊。

char *p = (char *) malloc(100);

strcpy(p, “hello”);

free(p); // p 所指的內存被釋放，但是p所指的地址仍然不變

…

if(p != NULL) // 沒有起到防錯作用

{

strcpy(p, “world”); // 出錯

}

示例7-5 p成爲野指針

7.6 動態內存會被自動釋放嗎？

函數體內的局部變量在函數結束時自動消亡。很多人誤以爲示例7-6是正確的。理由是p是局部的指針變量，它消亡的時候會讓它所指的動態內存一起完蛋。這是錯覺！

void Func(void)

{

char *p = (char *) malloc(100); // 動態內存會自動釋放嗎？

}

示例7-6 試圖讓動態內存自動釋放

我們發現指針有一些“似是而非”的特徵：

（1）指針消亡了，並不表示它所指的內存會被自動釋放。

（2）內存被釋放了，並不表示指針會消亡或者成了NULL指針。

這表明釋放內存並不是一件可以草率對待的事。也許有人不服氣，一定要找出可以草率行事的理由：

如果程序終止了運行，一切指針都會消亡，動態內存會被操作系統回收。既然如此，在程序臨終前，就可以不必釋放內存、不必將指針設置爲NULL了。終於可以偷懶而不會發生錯誤了吧？

想得美。如果別人把那段程序取出來用到其它地方怎麼辦？

7.7 杜絕“野指針”

“野指針”不是NULL指針，是指向“垃圾”內存的指針。人們一般不會錯用NULL指針，因爲用if語句很容易判斷。但是“野指針”是很危險的，if語句對它不起作用。

“野指針”的成因主要有兩種：

（1）指針變量沒有被初始化。任何指針變量剛被創建時不會自動成爲NULL指針，它的缺省值是隨機的，它會亂指一氣。所以，指針變量在創建的同時應當被初始化，要麼將指針設置爲NULL，要麼讓它指向合法的內存。例如

char *p = NULL;

char *str = (char *) malloc(100);

（2）指針p被free或者delete之後，沒有置爲NULL，讓人誤以爲p是個合法的指針。參見7.5節。

（3）指針操作超越了變量的作用範圍。這種情況讓人防不勝防，示例程序如下：

class A

{

public:

void Func(void){ cout << “Func of class A” << endl; }

};

void Test(void)

{

A *p;

{

A a;

p = &a; // 注意 a 的生命期

}

p->Func(); // p是“野指針”

}

函數Test在執行語句p->Func()時，對象a已經消失，而p是指向a的，所以p就成了“野指針”。但奇怪的是我運行這個程序時居然沒有出錯，這可能與編譯器有關。

7.8 有了malloc/free爲什麼還要new/delete ？

malloc與free是C++/C語言的標準庫函數，new/delete是C++的運算符。它們都可用於申請動態內存和釋放內存。

對於非內部數據類型的對象而言，光用maloc/free無法滿足動態對象的要求。對象在創建的同時要自動執行構造函數，對象在消亡之前要自動執行析構函數。由於malloc/free是庫函數而不是運算符，不在編譯器控制權限之內，不能夠把執行構造函數和析構函數的任務強加於malloc/free。

因此C++語言需要一個能完成動態內存分配和初始化工作的運算符new，以及一個能完成清理與釋放內存工作的運算符delete。注意new/delete不是庫函數。

我們先看一看malloc/free和new/delete如何實現對象的動態內存管理，見示例7-8。

class Obj

{

public :

Obj(void){ cout << “Initialization” << endl; }

~Obj(void){ cout << “Destroy” << endl; }

void Initialize(void){ cout << “Initialization” << endl; }

void Destroy(void){ cout << “Destroy” << endl; }

};

void UseMallocFree(void)

{

Obj *a = (obj *)malloc(sizeof(obj)); // 申請動態內存

a->Initialize(); // 初始化

//…

a->Destroy(); // 清除工作

free(a); // 釋放內存

}

void UseNewDelete(void)

{

Obj *a = new Obj; // 申請動態內存並且初始化

//…

delete a; // 清除並且釋放內存

}

示例7-8 用malloc/free和new/delete如何實現對象的動態內存管理

類Obj的函數Initialize模擬了構造函數的功能，函數Destroy模擬了析構函數的功能。函數UseMallocFree中，由於malloc/free不能執行構造函數與析構函數，必須調用成員函數Initialize和Destroy來完成初始化與清除工作。函數UseNewDelete則簡單得多。

所以我們不要企圖用malloc/free來完成動態對象的內存管理，應該用new/delete。由於內部數據類型的“對象”沒有構造與析構的過程，對它們而言malloc/free和new/delete是等價的。

既然new/delete的功能完全覆蓋了malloc/free，爲什麼C++不把malloc/free淘汰出局呢？這是因爲C++程序經常要調用C函數，而C程序只能用malloc/free管理動態內存。

如果用free釋放“new創建的動態對象”，那麼該對象因無法執行析構函數而可能導致程序出錯。如果用delete釋放“malloc申請的動態內存”，理論上講程序不會出錯，但是該程序的可讀性很差。所以new/delete必須配對使用，malloc/free也一樣。

7.9 內存耗盡怎麼辦？

如果在申請動態內存時找不到足夠大的內存塊，malloc和new將返回NULL指針，宣告內存申請失敗。通常有三種方式處理“內存耗盡”問題。

（1）判斷指針是否爲NULL，如果是則馬上用return語句終止本函數。例如：

void Func(void)

{

A *a = new A;

if(a == NULL)

{

return;

}

…

}

（2）判斷指針是否爲NULL，如果是則馬上用exit(1)終止整個程序的運行。例如：

void Func(void)

{

A *a = new A;

if(a == NULL)

{

cout << “Memory Exhausted” << endl;

exit(1);

}

…

}

（3）爲new和malloc設置異常處理函數。例如Visual C++可以用_set_new_hander函數爲new設置用戶自己定義的異常處理函數，也可以讓malloc享用與new相同的異常處理函數。詳細內容請參考C++使用手冊。

上述（1）（2）方式使用最普遍。如果一個函數內有多處需要申請動態內存，那麼方式（1）就顯得力不從心（釋放內存很麻煩），應該用方式（2）來處理。

很多人不忍心用exit(1)，問：“不編寫出錯處理程序，讓操作系統自己解決行不行？”

不行。如果發生“內存耗盡”這樣的事情，一般說來應用程序已經無藥可救。如果不用exit(1) 把壞程序殺死，它可能會害死操作系統。道理如同：如果不把歹徒擊斃，歹徒在老死之前會犯下更多的罪。

有一個很重要的現象要告訴大家。對於32位以上的應用程序而言，無論怎樣使用malloc與new，幾乎不可能導致“內存耗盡”。我在Windows 98下用Visual C++編寫了測試程序，見示例7-9。這個程序會無休止地運行下去，根本不會終止。因爲32位操作系統支持“虛存”，內存用完了，自動用硬盤空間頂替。我只聽到硬盤嘎吱嘎吱地響，Window 98已經累得對鍵盤、鼠標毫無反應。

我可以得出這麼一個結論：對於32位以上的應用程序，“內存耗盡”錯誤處理程序毫無用處。這下可把Unix和Windows程序員們樂壞了：反正錯誤處理程序不起作用，我就不寫了，省了很多麻煩。

我不想誤導讀者，必須強調：不加錯誤處理將導致程序的質量很差，千萬不可因小失大。

void main(void)

{

float *p = NULL;

while(TRUE)

{

p = new float[1000000];

cout << “eat memory” << endl;

if(p==NULL)

exit(1);

}

示例7-9試圖耗盡操作系統的內存

7.10 malloc/free 的使用要點

函數malloc的原型如下：

void * malloc(size_t size);

用malloc申請一塊長度爲length的整數類型的內存，程序如下：

int *p = (int *) malloc(sizeof(int) * length);

我們應當把注意力集中在兩個要素上：“類型轉換”和“sizeof”。

u malloc返回值的類型是void *，所以在調用malloc時要顯式地進行類型轉換，將void * 轉換成所需要的指針類型。

u malloc函數本身並不識別要申請的內存是什麼類型，它只關心內存的總字節數。我們通常記不住int, float等數據類型的變量的確切字節數。例如int變量在16位系統下是2個字節，在32位下是4個字節；而float變量在16位系統下是4個字節，在32位下也是4個字節。最好用以下程序作一次測試：

cout << sizeof(char) << endl;

cout << sizeof(int) << endl;

cout << sizeof(unsigned int) << endl;

cout << sizeof(long) << endl;

cout << sizeof(unsigned long) << endl;

cout << sizeof(float) << endl;

cout << sizeof(double) << endl;

cout << sizeof(void *) << endl;

在malloc的“()”中使用sizeof運算符是良好的風格，但要當心有時我們會昏了頭，寫出 p = malloc(sizeof(p))這樣的程序來。

u 函數free的原型如下：

void free( void * memblock );

爲什麼free函數不象malloc函數那樣複雜呢？這是因爲指針p的類型以及它所指的內存的容量事先都是知道的，語句free(p)能正確地釋放內存。如果p是NULL指針，那麼free對p無論操作多少次都不會出問題。如果p不是NULL指針，那麼free對p連續操作兩次就會導致程序運行錯誤。

7.11 new/delete 的使用要點

運算符new使用起來要比函數malloc簡單得多，例如：

int *p1 = (int *)malloc(sizeof(int) * length);

int *p2 = new int[length];

這是因爲new內置了sizeof、類型轉換和類型安全檢查功能。對於非內部數據類型的對象而言，new在創建動態對象的同時完成了初始化工作。如果對象有多個構造函數，那麼new的語句也可以有多種形式。例如

class Obj

{

public :

Obj(void); // 無參數的構造函數

Obj(int x); // 帶一個參數的構造函數

…

}

void Test(void)

{

Obj *a = new Obj;

Obj *b = new Obj(1); // 初值爲1

…

delete a;

delete b;

}

如果用new創建對象數組，那麼只能使用對象的無參數構造函數。例如

Obj *objects = new Obj[100]; // 創建100個動態對象

不能寫成

Obj *objects = new Obj[100](1);// 創建100個動態對象的同時賦初值1

在用delete釋放對象數組時，留意不要丟了符號‘[]’。例如

delete []objects; // 正確的用法

delete objects; // 錯誤的用法

後者相當於delete objects[0]，漏掉了另外99個對象。

7.12 一些心得體會

我認識不少技術不錯的C++/C程序員，很少有人能拍拍胸脯說通曉指針與內存管理（包括我自己）。我最初學習C語言時特別怕指針，導致我開發第一個應用軟件（約1萬行C代碼）時沒有使用一個指針，全用數組來頂替指針，實在蠢笨得過分。躲避指針不是辦法，後來我改寫了這個軟件，代碼量縮小到原先的一半。

我的經驗教訓是：

（1）越是怕指針，就越要使用指針。不會正確使用指針，肯定算不上是合格的程序員。

（2）必須養成“使用調試器逐步跟蹤程序”的習慣，只有這樣才能發現問題的本質。

高質量C++/C編程指南[7]

高質量C++/C編程指南[3]

C++/C代碼審查表

高質量C++/C編程指南[8]

高質量C++/C編程指南[5]

高質量C++/C編程指南[7]

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結