內存管理

七、內存管理

       在寫C/C++程序的時候,最頭疼的部分一定包括內存管理,一提到內存管理總是提心吊膽,但是又不可避免地常常會遇到,而這塊的知識也是公司招聘的一個評價方面,能夠很好地體現筆試面試者的功底。這部分的內容稍深一些,大家細心閱讀,能對內存管理有一個比較好的把握。

7.1 內存分配的方式

       最長被問到的問題之一,基礎中的基礎。對C和C++而言,內存分配方式有三種: 

       1)從靜態存儲區域分配。例如程序中定義的全局變量和static變量就是這種方式分配內存的。內存在程序編譯的時候就已經分配好,這塊內存在程序的整個運行期間都存在。 

       2)在棧上創建。這是出現最多的情況,我們程序中的int var就是這種情況的內存分配方式。在執行函數時,函數內局部變量的存儲單元都可以在棧上創建,函數執行結束時這些存儲單元自動被釋放。棧內存分配運算內置於處理器的指令集中,效率很高,但是分配的內存容量有限。 

       3)從堆上分配,亦稱動態內存分配。程序在運行的時候用m a lloc 或new 申請任意多少的內存,程序員自己負責在何時用free 或de lete 釋放內存。動態內存的生存期由我們決定,使用非常靈活,但問題也最多。 

6.2 常見的內存錯誤及其相應建議

       發生內存錯誤是件非常麻煩的事情。編譯器不能自動發現這些錯誤,通常是在程序運行時才能捕捉到。而這些錯誤大多沒有明顯的症狀,時隱時現,增加了改錯的難度。有時用戶怒氣衝衝地把你找來,程序卻沒有發生任何問題,你一走,錯誤又發作了。 

       常見的內存錯誤和處理方法如下: 

       1)內存分配未成功,卻使用了它。 

       編程新手常犯這種錯誤,因爲他們沒有意識到內存分配會不成功。常用解決辦法是,在使用內存之前檢查指針是否爲NULL 。如果指針p 是函數的參數,那麼在函數的入口處用assert (p!=NULL) 進行檢查。如果是用malloc或new 來申請內存,應該用if( p==NULL ) 或if(p!=NULL) 進行防錯處理。 

 

       2)內存分配雖然成功,但是尚未初始化就引用它。 

       犯這種錯誤主要有兩個起因:一是沒有初始化的觀念;二是誤以爲內存的缺省初值全爲零,導致引用初值錯誤(例如數組)。 

       內存的缺省初值究竟是什麼並沒有統一的標準,儘管有些時候爲零值,我們寧可信其無不可信其有。所以無論用何種方式創建數組,都別忘了賦初值,即便是賦零值也不可省略,不要嫌麻煩。 

 

      3)內存分配成功並且已經初始化,但操作越過了內存的邊界。 

       例如在使用數組時經常發生下標“多1 ”或者“少1 ”的操作。特別是在for 循環語句中,循環次數很容易搞錯,導致數組操作越界。 

 

       4)忘記了釋放內存,造成內存泄露。 

       含有這種錯誤的函數每被調用一次就丟失一塊內存。剛開始時系統的內存充足,你看不到錯誤。終有一次程序突然死掉,系統出現提示:內存耗盡。 

       動態內存的申請與釋放必須配對,程序中malloc與free 的使用次數一定要相同,否則肯定有錯誤(new/delete 同理)。 

 

      5)釋放了內存卻繼續使用它。 

       有三種情況: 

       1. 程序中的對象調用關係過於複雜,實在難以搞清楚某個對象究竟是否已經釋放了內存,此時應該重新設計數據結構,從根本上解決對象管理的混亂局面。 

       2. 函數的return 語句寫錯了,注意不要返回指向“棧內存”的“指針”或者“引用”,因爲該內存在函數體結束時被自動銷燬。 

       3. 使用free 或delete 釋放了內存後,沒有將指針設置爲NULL。導致產生“野指針”。 

       針對以上這些稍不留神,一疏忽就容易犯的錯誤,這裏提出以下建議:

              1)用malloc 或new 申請內存之後,應該立即檢查指針值是否爲NULL。防止使用指針值爲NULL的內存。 

              2)不要忘記爲數組和動態內存賦初值。防止將未被初始化的內存作爲右值使用。 

              3)避免數組或指針的下標越界,特別要當心發生“多1 ”或者“少1 ”操作。 

              4)動態內存的申請與釋放必須配對,防止內存泄漏。 

              5)用free 或delete 釋放了內存之後,立即將指針設置爲NUL L ,防止產生“野指針”

6.3 指針與數組

       C++/C程序中,指針和數組在不少地方可以相互替換着用,讓人產生一種錯覺,以爲兩者是等價的。

數組要麼在靜態存儲區被創建(如全局數組),要麼在棧上被創建。數組名對應着(而不是指向)一塊內存,其地址與容量在生命期內保持不變,只有數組的內容可以改變。

       指針可以隨時指向任意類型的內存塊,它的特徵是“可變”,所以我們常用指針來操作動態內存。指針遠比數組靈活,但也更危險。下面從一些角度說明指針和數組的不同。

       1)關於兩者的內容修改

       一個例子,以下程序:

  1. <span style="font-size:14px"><span style="font-family:SimSun">char a[] = “hello”;   
  2. a[0] = ‘X’;   
  3. cout << a << endl;   
  4. char *p = “world”; // 注意p指向常量字符串  
  5. p[0] = ‘X’; // 編譯器不能發現該錯誤  
  6. cout << p << endl;</span></span>  


       字符數組a的容量是6個字符,其內容爲hello\0(位於棧上)。a的內容可以改變,如a[0]=‘X’。指針p指向常量字符串“world”(位於靜態存儲區,內容爲world\0),常量字符串的內容是不可以被修改的。從語法上看,編譯器並不覺得語句p[0]= ‘X’有什麼不妥,但是該語句企圖修改常量字符串的內容而導致運行錯誤

       2)關於兩者進行內容複製

       不能對數組名進行直接複製與比較。示例7-3-2中,若想把數組a的內容複製給數組b,不能用語句b = a ,否則將產生編譯錯誤。應該用標準庫函數strcpy進行復制

       同理,比較b和a的內容是否相同,不能用if(b==a) 來判斷,應該用標準庫函數strcmp進行比較。

       語句p =a 並不能把a的內容複製指針p,而是把a的地址賦給了p。要想複製a的內容,可以先用庫函數malloc爲p申請一塊容量爲strlen(a)+1個字符的內存,再用strcpy進行字符串複製。同理,語句if(p==a) 比較的不是內容而是地址,應該用庫函數strcmp來比較。

       具體的例子如下程序所示:

  1. <span style="font-size:14px"><span style="font-family:SimSun">// 數組…  
  2. char a[] = "hello";   
  3. char b[10];   
  4. strcpy(b, a);  // 不能用  b = a;   
  5. if(strcmp(b, a) == 0) // 不能用if (b == a)   
  6. …  
  7. // 指針…  
  8. int len = strlen(a);   
  9. char *p = (char *)malloc(sizeof(char)*(len+1));   
  10. strcpy(p,a);  // 不要用p = a;   
  11. if(strcmp(p, a) == 0) // 不要用if (p == a)</span></span>  


       3)關於兩者內存容量的計算

       用運算符sizeof可以計算出數組的容量(字節數)。如下例程序中,sizeof(a)的值是12(注意別忘了’\0’)。指針p 指向a,但是sizeof(p)的值卻是4。這是因爲sizeof(p)得到的是一個指針變量的字節數,相當於sizeof(char*),而不是p所指的內存容量C++/C語言沒有辦法知道指針所指的內存容量,除非在申請內存時記住它。

  1. <span style="font-size:14px"><span style="font-family:SimSun">char a[] = "hello world";   
  2. char *p = a;   
  3. cout<< sizeof(a) << endl; // 12字節  
  4. cout<< sizeof(p) << endl; // 4字節</span></span>  


       注意當數組作爲函數的參數進行傳遞時,該數組自動退化爲同類型的指針。如下例中,不論數組a的容量是多少,sizeof(a)始終等於sizeof(char *)。

  1. <span style="font-size:14px"><span style="font-family:SimSun">void Func(char a[100])   
  2. {   
  3. cout<< sizeof(a) << endl; // 4字節而不是100字節  
  4. } </span></span>  


6.4 指針參數怎麼傳遞內存

       如果函數的參數是一個指針,不要指望用該指針去申請動態內存。如下例中,Test函數的語句GetMemory(str,200)並沒有使str獲得期望的內存,str依舊是NULL。

  1. <span style="font-size:14px"><span style="font-family:SimSun">void GetMemory(char *p, int num)   
  2. {   
  3. p = (char *)malloc(sizeof(char) * num);   
  4. }   
  5. void Test(void)   
  6. {   
  7. char *str = NULL;   
  8. GetMemory(str, 100);  // str 仍然爲NULL   
  9. strcpy(str, "hello"); // 運行錯誤  
  10. } </span></span>  


       我們來分析一下,其實上例的問題出在函數GetMemory中。編譯器總是要爲函數的每個參數製作臨時副本,指針參數p的副本是_p,編譯器使 _p= p。如果函數體內的程序修改了_p的內容,就導致參數p的內容作相應的修改。這就是指針可以用作輸出參數的原因。在本例中,_p申請了新的內存,只是把_p所指的內存地址改變了,但是p絲毫未變(形參有時候就是很害人)。所以函數GetMemory並不能輸出任何東西。事實上,每執行一次GetMemory就會泄露一塊內存,因爲沒有用free釋放內存。

       那如果筆試題或者面試官問,我一定要用指針參數去申請內存,我們怎麼做呢?好吧,那就耍個小花招,改用“指向指針的指針”好啦。如下程序所示:

  1. <span style="font-size:14px"><span style="font-family:SimSun">void GetMemory2(char **p, int num)   
  2. {   
  3. *p = (char *)malloc(sizeof(char) * num);   
  4. }  
  5. void Test2(void)   
  6. {   
  7. char *str = NULL;   
  8. GetMemory2(&str, 100); // 注意參數是&str,而不是str   
  9. strcpy(str, "hello");   
  10. cout<< str << endl;   
  11. free(str);   
  12. } </span></span>  


       什麼,你覺得“指向指針的指針”不是很容易理解?好吧,那換一種方式,我們可以用函數返回值來傳遞動態內存。如下程序所示:

  1. <span style="font-size:14px"><span style="font-family:SimSun">char *GetMemory3(int num)   
  2. {   
  3. char *p = (char *)malloc(sizeof(char) * num);   
  4. return p;   
  5. }  
  6. void Test3(void)   
  7. {   
  8. char *str = NULL;   
  9. str = GetMemory3(100);   
  10. strcpy(str, "hello");   
  11. cout<< str << endl;   
  12. free(str);   
  13. } </span></span>  


       寫到這裏,又有一個可能會犯的錯誤需要提一下了,很重要,大家一定要注意了。用函數返回值來傳遞動態內存這種方法雖然好用,但是常常有人把return語句用錯了。這裏強調不要用return語句返回指向“棧內存”的指針因爲該內存在函數結束時自動消亡!如下程序所示:

  1. <span style="font-size:14px"><span style="font-family:SimSun">char *GetString(void)   
  2. {   
  3. char p[] = "hello world";   
  4. return p;  // 編譯器將提出警告  
  5. }   
  6. void Test4(void)   
  7. {   
  8. char *str = NULL;   
  9. str = GetString(); // str 的內容是垃圾  
  10. cout<< str << endl;   
  11. } </span></span>  


       如果用調試器逐步跟蹤Test4,發現執行str = GetString語句後str不再是NULL指針,但是str的內容不是“hello world”而是垃圾。

       寫到這裏,又有人提出問題了,如果上例中的hello world是常字符串,那會怎麼樣呢,就如下程序所示:

  1. <span style="font-size:14px"><span style="font-family:SimSun">char *GetString2(void)   
  2. {   
  3. char *p = "hello world";   
  4. return p;   
  5. }   
  6. void Test5(void)   
  7. {   
  8. char *str = NULL;   
  9. str = GetString2();   
  10. cout<< str << endl;   
  11. }</span></span>  


       那這裏要說明的是,事實上這段程序運行不會出錯,但是函數GetString2的設計概念卻是錯誤的。因爲GetString2 內的“hello world”是常量字符串,位於靜態存儲區,它在程序生命期內恆定不變。無論什麼時候調用GetString2,它返回的始終是同一個“只讀”的內存塊,所以沒有太大的意義。

6.5 關於free和delete

       別看free和delete的名字惡狠狠的(尤其是delete),它們只是把指針所指的內存給釋放掉,但指針本身卻被留下來了

       用調試器跟蹤下例,發現指針p被free以後其地址仍然不變(非NULL),只是該地址對應的內存是垃圾,p成了“野指針”。如果此時不把p設置爲NULL,會讓人誤以爲p是個合法的指針。

  1. <span style="font-size:14px"><span style="font-family:SimSun">char *p = (char *) malloc(100);   
  2. strcpy(p, “hello”);   
  3. free(p);  // p  所指的內存被釋放,但是p所指的地址仍然不變  
  4. …  
  5. if(p != NULL)  // 沒有起到防錯作用  
  6. {   
  7. strcpy(p, “world”); // 出錯  
  8. } </span></span>  


       如果程序比較長,我們有時記不住p所指的內存是否已經被釋放,在繼續使用p之前,通常會用語句if(p!=NULL)進行防錯處理。很遺憾,此時if語句起不到防錯作用,因爲即便p不是NULL指針,它也不指向合法的內存塊

6.6 動態內存會隨程序結束自動釋放嗎

       現在有這樣一個例子:

  1. <span style="font-size:14px"><span style="font-family:SimSun">void Func(void)   
  2. {   
  3. char *p = (char *) malloc(100);  // 動態內存會自動釋放嗎?  
  4. }</span></span>  


       我們都知道函數體內的局部變量會在函數結束時自動消亡。這裏p是局部的指針變量,程序結束後它會消亡,但是它消亡時它所指的動態內存會一起完蛋嗎?答案是:並不會...

       這裏有兩條非常有趣的結論,分別是:

              (1)指針消亡了,並不表示它所指的內存會被自動釋放。

              (2)內存被釋放了,並不表示指針會消亡或者成了NULL指針。

6.7 關於“野指針”

       “野指針”是最可怕的一類指針,它不是NULL指針,是指向“垃圾”內存的指針。人們一般不會錯用NULL指針,因爲用if語句很容易判斷。但是“野指針”是很危險的,if語句對它不起作用。

       “野指針”的成因主要有兩種:

       (1)指針變量沒有被初始化。任何指針變量剛被創建時不會自動成爲NULL指針,它的缺省值是隨機的,它會亂指一氣。所以,指針變量在創建的同時應當被初始化,要麼將指針設置爲NULL,要麼讓它指向合法的內存。例如

  1. <span style="font-size:14px"><span style="font-family:SimSun">char *p = NULL;   
  2. char *str = (char *) malloc(100); </span></span>  


       (2)指針p被free或者delete之後,沒有置爲NULL,讓人誤以爲p是個合法的指針。上一節也提到了這個問題。

       (3)指針操作超越了變量的作用範圍。這種情況讓人防不勝防,示例程序如下:現在有這樣一個例子:

  1. <span style="font-size:14px"><span style="font-family:SimSun">class A   
  2. {   
  3. public:   
  4. void Func(void){ cout << “Func of class A”<< endl; }   
  5. };   
  6. void Test(void)   
  7. {   
  8. A *p;   
  9. {   
  10. A  a;   
  11. p = &a; // 注意a 的生命期  
  12. }   
  13. p->Func(); // p是“野指針”  
  14. } </span></span>  


       函數Test 在執行語句p->Func()時,對象a已經消失,而p是指向a的,所以p就成了“野指針”。

6.8 malloc/free和new/delete

       malloc與free是C++/C語言的標準庫函數,new/delete 是C++的運算符。它們都可用於申請動態內存和釋放內存。

       對於非內部數據類型的對象而言,光用maloc/free無法滿足動態對象的要求。對象在創建的同時要自動執行構造函數,對象在消亡之前要自動執行析構函數。由於malloc/free 是庫函數而不是運算符,不在編譯器控制權限之內,不能夠把執行構造函數和析構函數的任務強加於malloc/free。

       因此C++語言需要一個能完成動態內存分配和初始化工作的運算符new,以及一個能完成清理與釋放內存工作的運算符delete。注意new/delete不是庫函數。

malloc/free和new/delete實現對象的動態內存管理的方法是不同的,下面是一個示例:

  1. <span style="font-size:14px"><span style="font-family:SimSun">class Obj   
  2. {   
  3. public :   
  4. Obj(void){ cout << “Initialization”<< endl; }   
  5. ~Obj(void){ cout << “Destroy”<< endl; }   
  6. void  Initialize(void){ cout << “Initialization”<< endl; }   
  7. void Destroy(void){ cout << “Destroy”<< endl; }   
  8. };  
  9. void UseMallocFree(void)   
  10. {   
  11. Obj *a = (obj *)malloc(sizeof(obj)); // 申請動態內存  
  12. a->Initialize();  // 初始化  
  13. //…  
  14. a->Destroy();  // 清除工作  
  15. free(a);    // 釋放內存  
  16. }  
  17. void UseNewDelete(void)   
  18. {   
  19. Obj *a = new Obj; // 申請動態內存並且初始化  
  20. //…  
  21. delete a;  // 清除並且釋放內存  
  22. }</span></span>  


       類Obj的函數Initialize模擬了構造函數的功能,函數Destroy模擬了析構函數的功能。函數UseMallocFree中,由於malloc/free不能執行構造函數與析構函數,必須調用成員函數Initialize和Destroy來完成初始化與清除工作。函數UseNewDelete則簡單得多。

       所以我們不要企圖用malloc/free來完成動態對象的內存管理,應該用new/delete。由於內部數據類型的“對象”沒有構造與析構的過程,對它們而言malloc/free和new/delete是等價的。

       既然new/delete的功能完全覆蓋了malloc/free,爲什麼C++不把malloc/free淘汰出局呢?這是因爲C++程序經常要調用C函數,而C程序只能用malloc/free管理動態內存。

       如果用free釋放“new創建的動態對象”,那麼該對象因無法執行析構函數而可能導致程序出錯。如果用delete釋放“malloc申請的動態內存”,理論上講程序不會出錯,但是該程序的可讀性很差。所以new/delete必須配對使用,malloc/free也一樣。

6.9 關於“內存耗盡”問題

       如果在申請動態內存時找不到足夠大的內存塊,malloc和new將返回NULL指針,宣告內存申請失敗。通常有三種方式處理“內存耗盡”問題。

       1)判斷指針是否爲NULL,如果是則馬上用return語句終止本函數。例如:

  1. <span style="font-size:14px"><span style="font-family:SimSun">void Func(void)   
  2. {   
  3. A *a = new A;   
  4. if(a == NULL)   
  5. {   
  6. return;   
  7. }   
  8. …  
  9. } </span></span>  



       2)判斷指針是否爲NULL,如果是則馬上用exit(1)終止整個程序的運行。例如:

  1. <span style="font-size:14px"><span style="font-family:SimSun">void Func(void)   
  2. {   
  3. A *a = new A;   
  4. if(a == NULL)   
  5. {   
  6. cout << “Memory Exhausted”<< endl;   
  7. exit(1);   
  8. }   
  9. …  
  10. } </span></span>  


       3)爲new和malloc設置異常處理函數。例如VisualC++可以用_set_new_hander函數爲new設置用戶自己定義的異常處理函數,也可以讓malloc享用與new相同的異常處上述(1)(2)方式使用最普遍。如果一個函數內有多處需要申請動態內存,那麼方式(1)就顯得力不從心(釋放內存很麻煩),應該用方式(2)來處理。

       很多人不忍心用exit(1),問:“不編寫出錯處理程序,讓操作系統自己解決行不行?”

       不行。如果發生“內存耗盡”這樣的事情,一般說來應用程序已經無藥可救。如果不用exit(1) 把壞程序殺死,它可能會害死操作系統。道理如同:如果不把歹徒擊斃,歹徒在老死之前會犯下更多的罪。

       雖然對於32 位以上的應用程序而言,無論怎樣使用malloc與new,幾乎不可能導致“內存耗盡”。但是:不加錯誤處理將導致程序的質量很差,千萬不可因小失大。

6.10 再說malloc/free

       函數malloc的原型如下:

  1. <span style="font-size:14px"><span style="font-family:SimSun">void * malloc(size_t size); </span></span>  


       用malloc申請一塊長度爲length的整數類型的內存,程序如下:

  1. <span style="font-size:14px"><span style="font-family:SimSun">int *p = (int *) malloc(sizeof(int) * length); </span></span>  


       我們應當把注意力集中在兩個要素上:“類型轉換”和“sizeof”。

        1)malloc返回值的類型是void *,所以在調用malloc時要顯式地進行類型轉換,將void * 轉換成所需要的指針類型。

        2)malloc 函數本身並不識別要申請的內存是什麼類型,它只關心內存的總字節數。我

們通常記不住int,float 等數據類型的變量的確切字節數。例如int變量在16位系統下是2個字節,在32位下是4個字節;而float變量在16位系統下是4個字節,在32位下也是4個字節。最好用以下程序作一次測試:

  1. <span style="font-size:14px"><span style="font-family:SimSun">cout << sizeof(char) << endl;   
  2. cout << sizeof(int) << endl;   
  3. cout << sizeof(unsigned int) << endl;   
  4. cout << sizeof(long) << endl;   
  5. cout << sizeof(unsigned long) << endl;   
  6. cout << sizeof(float) << endl;   
  7. cout << sizeof(double) << endl;   
  8. cout << sizeof(void *) << endl; </span></span>  


       在malloc的“()”中使用sizeof運算符是良好的風格,但要當心有時我們會昏了頭,寫出p = malloc(sizeof(p))這樣的程序來。

       3)函數free的原型如下:

  1. <span style="font-size:14px"><span style="font-family:SimSun">void free( void * memblock ); </span></span>  


       爲什麼free函數不象malloc函數那樣複雜呢?這是因爲指針p的類型以及它所指的內存的容量事先都是知道的,語句free(p)能正確地釋放內存。如果p是NULL指針,那麼free對p無論操作多少次都不會出問題。如果p不是NULL指針,那麼free對p連續操作兩次就會導致程序運行錯誤。

6.11 再說new/delete

       運算符new使用起來要比函數malloc簡單得多,例如:

  1. <span style="font-size:14px"><span style="font-family:SimSun">int *p1 = (int *)malloc(sizeof(int) * length);   
  2. int *p2 = new int[length]; </span></span>  


       這是因爲new內置了sizeof、類型轉換和類型安全檢查功能。對於非內部數據類型的對象而言,new在創建動態對象的同時完成了初始化工作。如果對象有多個構造函數,那麼new的語句也可以有多種形式。例如

  1. <span style="font-size:14px"><span style="font-family:SimSun">class Obj   
  2. {   
  3. public :   
  4. Obj(void);   // 無參數的構造函數  
  5. Obj(int x); // 帶一個參數的構造函數   
  6. …  
  7. }   
  8. void Test(void)   
  9. {   
  10. Obj *a = new Obj;   
  11. Obj *b = new Obj(1); // 初值爲1   
  12. …  
  13. delete a;   
  14. delete b;   
  15. } </span></span>  


       如果用new創建對象數組,那麼只能使用對象的無參數構造函數。例如

  1. <span style="font-size:14px"><span style="font-family:SimSun">Obj *objects = new Obj[100]; // 創建100個動態對象</span></span>  


       不能寫成

  1. <span style="font-size:14px"><span style="font-family:SimSun">Obj *objects = new Obj[100](1);// 創建100個動態對象的同時賦初值1 </span></span>  


       在用delete釋放對象數組時,留意不要丟了符號‘[]’。例如

  1. <span style="font-size:14px"><span style="font-family:SimSun">delete []objects; // 正確的用法  
  2. delete objects;  // 錯誤的用法</span></span>  


       後者相當於delete objects[0],漏掉了另外99個對象。

6.12 總結

       知識點在上已經一一敘述過了,這裏總結兩句話:

              1)越是怕指針,就越要使用指針。不會正確使用指針,肯定算不上是合格的程序員。

              2)必須養成“使用調試器逐步跟蹤程序”的習慣,只有這樣才能發現問題的本質。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章