高質量C++/C編程指南[7]

 
7 內存管理
              歡迎進入內存這片雷區。偉大的Bill Gates 曾經失言:
640K ought to be enough for everybody
— Bill Gates 1981
程序員們經常編寫內存管理程序,往往提心吊膽。如果不想觸雷,唯一的解決辦法就是發現所有潛伏的地雷並且排除它們,躲是躲不了的。本章的內容比一般教科書的要深入得多,讀者需細心閱讀,做到真正地通曉內存管理。
7.1內存分配方式
內存分配方式有三種:
(1)       從靜區域分配內存在程序編譯候就已分配好,這塊內存在程序的整個運行期都存在。例如全局量,static量。
(2)       在棧上創建。行函,函數內局部量的存儲單元都可以在,函數執行結束時這些存儲單元自動被釋放。棧內存分配運算內置於處理器的指令集中,效率很高,但是分配的內存容量有限。
(3)       從堆上分配,亦動態內存分配。程序在運行的時候用malloc或new申請任意多少的內存,程序員自己負責在何時用free或delete釋放內存。動態內存的生存期由我們決定,使用非常靈活,但問題也最多。
7.2的內存錯誤及其
              發生內存錯誤是件非常麻煩的事情。編譯器不能自動發現這些錯誤,通常是在程序運行時才能捕捉到。而這些錯誤大多沒有明顯的症狀,時隱時現,增加了改錯的難度。有時用戶怒氣衝衝地把你找來,程序卻沒有發生任何問題,你一走,錯誤又發作了。
常見的內存錯誤及其對策如下:
u       內存分配未成功,卻使用了它。
編程新手常犯這種錯誤,因爲他們沒有意識到內存分配會不成功。常用解決辦法是,在使用內存之前檢查指針是否爲NULL。如果指針p是函數的參數,那麼在函數的入口處用assert(p!=NULL)進行檢查。如果是用malloc或new來申請內存,應該用if(p==NULL) 或if(p!=NULL)進行防錯處理。
 
u       存分配然成功,但是尚未初始化就引用它。
犯這種錯誤主要有兩個起因:一是沒有初始化的念;二是內存的缺省初零,致引用初值錯誤(例如數)。
內存的缺省初值究竟是什麼並沒有統一的標準,儘管有些時候爲零值,我們寧可信其無不可信其有。所以無論用何種方式創建數組,都別忘了賦初值,即便是賦零值也不可省略,不要嫌麻煩。
 
u       內存分配成功並且已初始化,但操作越了內存的界。
例如在使用數組時經常發生下標“多1”或者“少1”的操作。特別是在for循環語句中,循環次數很容易搞錯,導致數組操作越界。
 
u      放內存,造成內存泄露。
含有這種錯誤的函數每被調用一次就丟失一塊內存。剛開始時系統的內存充足,你看不到錯誤。終有一次程序突然死掉,系統出現提示:內存耗盡。
動態內存的申請與釋放必須配對,程序中malloc與free的使用次數一定要相同,否則肯定有錯誤(new/delete同理)。
 
u      放了內存卻繼續使用它。
有三種情況:
(1)程序中的對象調用關係過於複雜,實在難以搞清楚某個對象究竟是否已經釋放了內存,此時應該重新設計數據結構,從根本上解決對象管理的混亂局面。
(2)函數的return語句寫錯了,注意不要返回指向“棧內存”的“指針”或者“引用”,因爲該內存在函數體結束時被自動銷燬。
(3)使用free或delete釋放了內存後,沒有將指針設NULL野指
 
l         規則7-2-1用malloc或new申請內存之後,應該立即檢查指針值是否爲NULL。防止使用指針值爲NULL的內存。
l         規則7-2-2不要忘記爲動態內存防止將未被初始化的內存作爲右值使用。
l         規則7-2-3避免數組或指針的下標越界,特別要當心發生“多1”或者“少1”操作。
l         規則7-2-4動態內存的申請與釋放必須配對,防止內存泄漏。
l         規則7-2-5用free或delete釋放了內存之後,立即將指針設置爲NULL,防止產生“野指針”。
7.3與數
              C++/C程序中,和數在不少地方可以相互替着用,讓人產生一種錯覺,以爲兩者是等價的。
              在靜區被建(如全局數),要上被。數組名對應着(而不是指向)一塊內存,其地址與容量在生命期內保持不,只有數的內容可以改
指針可以隨時指向任意類型的內存塊,它的特徵是“可變”,所以我們常用指針來操作動態內存。指針遠比數組靈活,但也更危險。
下面以字符串爲例比較指針與數組的特性。
 
7.3.1修改內容
              示例7-3-1中,字符數組a的容量是6個字符,其內容爲hello/0。a的內容可以改變,如a[0]= ‘X’。指針p指向常量字符串“world”(位於靜態存儲區,內容爲world/0),常量字符串的內容是不可以被修改的。從語法上看,編譯器並不覺得語句p[0]= ‘X’有什麼不妥,但是該語句企圖修改常量字符串的內容而導致運行錯誤。
 
char a[] = “hello”;
a[0] = ‘X’;
cout << a << endl;
char *p = “world”;     // 注意p指向常量字符串
p[0] = ‘X’;                // 編譯器不能發現該錯誤
cout << p << endl;
示例7-3-1修改數和指的內容
 
7.3.2內容制與比
              不能行直接制與比。示例7-3-2中,若想把數組a的內容複製給數組b,不能用 b = a ,否編譯錯誤應該用標函數strcpy制。同理,比較b和a的內容是否相同,不能用if(b==a) 來判斷,應該用標準庫函數strcmp進行比較。
              語句p = a 並不能把a的內容複製指針p,而是把a的地址賦給了p。要想複製a的內容,可以先用庫函數malloc爲p申請一塊容量爲strlen(a)+1個字符的內存,再用strcpy進行字符串複製。同理,語句if(p==a) 比較的不是內容而是地址,應該用庫函數strcmp來比較。
 
        // 數組…
              char a[] = "hello";
              char b[10];
              strcpy(b, a);                                      // 不能用              b = a;
              if(strcmp(b, a) == 0)            // 不能用 if (b == a)
        // 指針…
        int len = strlen(a);
        char *p = (char *)malloc(sizeof(char)*(len+1));
        strcpy(p,a);                    // 不要用 p = a;
        if(strcmp(p, a) == 0)   // 不要用 if (p == a)
示例7-3-2數組和指針的內容複製與比較
 
 
7.3.3計算內存容量
        用運算sizeof可以計算出數組的容量(字節數)。示例7-3-3(a)中,sizeof(a)的值是12(注意別忘了’/0)。指針p指向a,但是sizeof(p)的值卻是4這是因爲sizeof(p)得到的是一個指針變量的字節數,相當於sizeof(char*),而不是p所指的內存容量。C++/C語言沒有辦法知道指針所指的內存容量,除非在申請內存時記住它。
注意當數組作爲函數的參數進行傳遞時,該數組自動退化爲同類型的指針。示例7-3-3(b)中,不論數組a的容量是多少,sizeof(a)始終等於sizeof(char *)。
 
        char a[] = "hello world";
              char *p = a;
              cout<< sizeof(a) << endl;      // 12字節
              cout<< sizeof(p) << endl;      // 4字節
示例7-3-3a算數和指的內存容量
             
        void Func(char a[100])
              {
                            cout<< sizeof(a) << endl;      // 4字節而不是100字節
}
示例7-3-3b退化
7.4參數是如何傳遞內存的?
             如果函數的參數是一個指,不要指望用去申請動態內存。示例7-4-1中,Test函數的語句GetMemory(str, 200)並沒有使str獲得期望的內存,str依舊是NULL,爲什麼?
 
void GetMemory(char *p, int num)
{
       p = (char *)malloc(sizeof(char) * num);
}
void Test(void)
{
    char *str = NULL;
    GetMemory(str, 100);    // str 仍然爲 NULL     
    strcpy(str, "hello");   // 運行錯誤
}
示例7-4-1試圖用指針參數申請動態內存
 
毛病出在函數GetMemory中。編譯器總是要爲函數的每個參數製作臨時副本,指針參數p的副本是 _p,編譯器使 _p = p。如果函數體內的程序修改了_p的內容,就導致參數p的內容作相應的修改。這就是指針可以用作輸出參數的原因。在本例中,_p申請了新的內存,只是把_p所指的內存地址改變了,但是p絲毫未變。所以函數GetMemory並不能輸出任何東西。事實上,每執行一次GetMemory就會泄露一塊內存,因爲沒有用free釋放內存。
如果非得要用指針參數去申請內存,那麼應該改用“指向指針的指針”,見示例7-4-2。
 
void GetMemory2(char **p, int num)
{
       *p = (char *)malloc(sizeof(char) * num);
}
void Test2(void)
{
    char *str = NULL;
    GetMemory2(&str, 100); // 注意參數是 &str而不是str
    strcpy(str, "hello");  
    cout<< str << endl;
    free(str);     
}
示例7-4-2用指向指針的指針申請動態內存
 
由於“指向指針的指針”這個概念不容易理解,我們可以用函數返回值來傳遞動態內存。這種方法更加簡單,見示例7-4-3
 
char *GetMemory3(int num)
{
       char *p = (char *)malloc(sizeof(char) * num);
       return p;
}
void Test3(void)
{
    char *str = NULL;
    str = GetMemory3(100); 
    strcpy(str, "hello");
    cout<< str << endl;
    free(str);     
}
示例7-4-3用函數返回值來傳遞動態內存
 
用函數返回值來傳遞動態內存這種方法雖然好用,但是常常有人把return語句用錯了。這裏強調不要用return語句返回指向“棧內存”的指針,因爲該內存在函數結束時自動消亡,見示例7-4-4。
 
char *GetString(void)
{
       char p[] = "hello world";
       return p; // 編譯器將提出警告
}
void Test4(void)
{
char *str = NULL;
str = GetString();      // str 的內容是垃圾
cout<< str << endl;
}
示例7-4-4 return語句返回指向“棧內存”的指針
 
用調試器逐步跟蹤Test4,發現執行str = GetString語句後str不再是NULL指針,但是str的內容不是“hello world”而是垃圾。
如果把示例7-4-4改寫成示例7-4-5,會怎麼樣?
 
char *GetString2(void)
{
       char *p = "hello world";
       return p;
}
void Test5(void)
{
    char *str = NULL;
    str = GetString2();
    cout<< str << endl;
}
示例7-4-5 return語句返回常量字符串
 
函數Test5運行雖然不會出錯,但是函數GetString2的設計概念卻是錯誤的。因爲GetString2內的“hello world”是常量字符串,位於靜態存儲區,它在程序生命期內恆定不變。無論什麼時候調用GetString2,它返回的始終是同一個“只讀”的內存塊
 
7.5 freedelete把指啦?
別看free和delete的名字惡狠狠的(尤其是delete),它們只是把指針所指的內存給釋放掉,但並沒有把指針本身幹掉。
用調試器跟蹤示例7-5,發現指針p被free以後其地址仍然不變(非NULL),只是該地對應的內存是垃圾,p成了野指。如果此不把pNULL,會p是個合法的指
如果程序比較長,我們有時記不住p所指的內存是否已經被釋放,在繼續使用p之前,通常會用語句if (p != NULL)進行防錯處理。很遺憾,此時if語句起不到防錯作用,因爲即便p不是NULL指針,它也不指向合法的內存塊。
 
        char *p = (char *) malloc(100);
              strcpy(p, “hello”);
              free(p);       // p 所指的內存被釋放,但是p所指的地址仍然不變
             
              if(p != NULL)        // 沒有起到防錯作用
              {
                 strcpy(p, “world”);          // 出錯
}
示例7-5 p野指
7.6 動態內存會被自動釋
              函數體內的局部變量在函數結束時自動消亡。很多人誤以爲示例7-6是正確的。理由是p是局部的指針變量,它消亡的時候會讓它所指的動態內存一起完蛋。這是錯覺!
 
        void Func(void)
{
       char *p = (char *) malloc(100);           // 動態內存會自動釋
}
示例7-6 試圖讓動態內存自動釋
 
              我們發現指針有一些“似是而非”的特徵:
1消亡了,並不表示它所指的內存會被自動釋放。
2)內存被放了,並不表示指會消亡或者成了NULL
這表明釋放內存並不是一件可以草率對待的事。也許有人不服氣,一定要找出可以草率行事的理由:
              如果程序終止了運行,一切指針都會消亡,動態內存會被操作系統回收。既然如此,在程序臨終前,就可以不必釋放內存、不必將指針設置爲NULL了。終於可以偷懶而不會發生錯誤了吧?
              想得美。如果人把那段程序取出來用到其它地方怎麼辦
7.7 野指
野指不是NULL,是指向垃圾內存的指。人們一般不會錯用NULL指針,因爲用if語句很容易判斷。但是“野指針”是很危險的,if語句對它不起作用。
“野指針”的成因主要有兩種:
(1)針變量沒有被初始化。任何指針變量剛被創建時不會自動成爲NULL指針,它的缺省值是隨機的,它會亂指一氣。所以,指針變量在創建的同時應當被初始化,要麼將指針設置爲NULL,要麼讓它指向合法的內存。例如
              char *p = NULL;
              char *str = (char *) malloc(100);
 
(2)指針p被free或者delete之後,沒有置NULLp是個合法的指。參7.5
 
(3)操作超越了量的作用範這種情況人防不防,示例程序如下
              class A
{    
public:
       void Func(void){ cout << “Func of class A” << endl; }
};
              void Test(void)
{
       A *p;
                     {
                                   A a;
                                   p = &a;   // 注意 a 的生命期
}
                            p->Func();                          // p是“野指針”
}
 
函數Test在執行語句p->Func()時,對象a已經消失,而p是指向a的,所以p就成了“野指針”。但奇怪的是我運行這個程序時居然沒有出錯,這可能與編譯器有關。
 
7.8 有了malloc/free麼還new/delete
              malloc與free是C++/C語言的標準庫函數,new/delete是C++的運算符。它們都可用於申請動態內存和釋放內存。
於非內部數據型的象而言,光用maloc/free無法滿動態對象的要求。對象在創建的同時要自動執行構造函數,對象在消亡之前要自動執行析構函數。由於malloc/free是庫函數而不是運算符,不在編譯器控制權限之內,不能夠把執行構造函數和析構函數的任務強加於malloc/free。
              因此C++語言需要一個能完成動態內存分配和初始化工作的運算符new,以及一個能完成清理與放內存工作的運算符delete。注意new/delete不是函數。
我們先看一看malloc/free和new/delete如何實現對象的動態內存管理,見示例7-8。
 
class Obj
{
public :
                     Obj(void){ cout << “Initialization” << endl; }
~Obj(void){ cout << “Destroy” << endl; }
void Initialize(void){ cout << “Initialization” << endl; }
void    Destroy(void){ cout << “Destroy” << endl; }
};
void UseMallocFree(void)
{
    Obj *a = (obj *)malloc(sizeof(obj));   // 申請動態內存
    a->Initialize();                                                // 初始化
    //
    a->Destroy();   // 清除工作
    free(a);                // 釋放內存
}
void UseNewDelete(void)
{
    Obj *a = new Obj;      // 申請動態內存並且初始化
    //
    delete a;                       // 清除並且釋放內存
}
示例7-8 malloc/freenew/delete如何實現對象的動態內存管理
 
類Obj的函數Initialize模擬了構造函數的功能,函數Destroy模擬了析構函數的功能。函數UseMallocFree中,由malloc/free不能執行構造函數與析構函數,必須調用成員函數InitializeDestroy來完成初始化與清除工作。函數UseNewDelete則簡單得多。
所以我們不要企圖用malloc/free來完成動態對象的內存管理,應該用new/delete。由於內部數據類型的“對象”沒有構造與析構的過程,對它們而言malloc/free和new/delete是等價的。
        既然new/delete的功能完全覆蓋了malloc/free,爲什麼C++不把malloc/free淘汰出局呢?這是因爲C++程序經常要調用C函數,而C程序只能用malloc/free管理動態內存。
如果用free釋放“new創建的動態對象”,那麼該對象因無法執行析構函數而可能導致程序出錯。如果用delete釋放“malloc申請的動態內存”,理論上講程序不會出錯,但是該程序的可讀性很差。所以new/delete必須配對使用,malloc/free也一樣。
7.9 內存耗盡怎麼辦?
              如果在申請動態內存時找不到足夠大的內存塊,malloc和new將返回NULL指針,宣告內存申請失敗。通常有三種方式處理“內存耗盡”問題。
(1)判斷指是否NULL,如果是則馬上用return止本函數。例如:
void Func(void)
{
A *a = new A;
if(a == NULL)
{
              return;
       }
}
 
(2)判斷指是否NULL,如果是則馬上用exit(1)止整個程序的運行。例如:
void Func(void)
{
A *a = new A;
if(a == NULL)
{
              cout << “Memory Exhausted” << endl;
              exit(1);
}
      
}
 
(3)爲new和malloc設置異常處理函數。例如Visual C++可以用_set_new_hander函數爲new設置用戶自己定義的異常處理函數,也可以讓malloc享用與new相同的異常處理函數。詳細內容請參考C++使用手冊。
 
              上述(1)(2)方式使用最普遍。如果一個函數內有多處需要申請動態內存,那麼方式(1)就顯得力不從心(釋放內存很麻煩),應該用方式(2)來處理。
很多人不忍心用exit(1),問:“不編寫出錯處理程序,讓操作系統自己解決行不行?”
              不行。如果內存耗盡這樣的事情,一般用程序已可救。如果不用exit(1) 把壞程序殺死,它可能會害死操作系統。道理如同:如果不把歹徒擊斃,歹徒在老死之前會犯下更多的罪。
 
              有一個很重要的現象要告訴大家。對於32位以上的應用程序而言,無論怎樣使用malloc與new,幾乎不可能導致“內存耗盡”。我在Windows 98下用Visual C++編寫了測試程序,見示例7-9。這個程序會無休止地運行下去,根本不會終止。因爲32位操作系統支持“虛存”,內存用完了,自動用硬盤空間頂替。我只聽到硬盤嘎吱嘎吱地響,Window 98已經累得對鍵盤、鼠標毫無反應。
我可以得出這麼一個結論:對於32位以上的應用程序,“內存耗盡”錯誤處理程序毫無用處。這下可把Unix和Windows程序員們樂壞了:反正錯誤處理程序不起作用,我就不寫了,省了很多麻煩。
我不想誤導讀者,必須強調:不加錯誤處理將致程序的量很差,千萬不可因小失大
 
void main(void)
{
       float *p = NULL;
       while(TRUE)
       {
                     p = new float[1000000];      
                     cout << “eat memory” << endl;
                     if(p==NULL)
                                   exit(1);
       }
}
示例7-9試圖耗盡操作系的內存
7.10 malloc/free 的使用要點
              函數malloc的原型如下:
                            void * malloc(size_t size);
              malloc塊長length的整數型的內存,程序如下:
                            int *p = (int *) malloc(sizeof(int) * length);
我們應當把注意力集中在兩個要素上:“類型轉換”和“sizeof”。
u       malloc返回值的類型是void *,所以在調用malloc時要顯式地進行類型轉換,將void * 轉換成所需要的指針類型。
u       malloc函數本身並不識別要申請的內存是什麼類型,它只心內存的。我們通常記不住int, float等數據類型的變量的確切字節數。例如int變量在16位系統下是2個字節,在32位下是4個字節;而float變量在16位系統下是4個字節,在32位下也是4個字節。最好用以下程序作一次測試:
cout << sizeof(char) << endl;
cout << sizeof(int) << endl;
cout << sizeof(unsigned int) << endl;
cout << sizeof(long) << endl;
cout << sizeof(unsigned long) << endl;
cout << sizeof(float) << endl;
cout << sizeof(double) << endl;
              cout << sizeof(void *) << endl;
             
              在malloc的“()”中使用sizeof運算符是良好的風格,但要當心有時我們會昏了頭,寫出 p = malloc(sizeof(p))這樣的程序來。
 
u       函數free的原型如下:
void free( void * memblock );
              爲什麼free函數不象malloc函數那樣複雜呢?這是因爲指針p的類型以及它所指的內存的容量事先都是知道的,語句free(p)能正確地釋放內存。如果p是NULL指針,那麼free對p無論操作多少次都不會出問題。如果p不是NULL指針,那麼free對p連續操作兩次就會導致程序運行錯誤。
7.11 new/delete 的使用要點
              運算符new使用起來要比函數malloc簡單得多,例如:
int *p1 = (int *)malloc(sizeof(int) * length);
int *p2 = new int[length];
這是因爲new內置了sizeof、類型轉換和類型安全檢查功能。對於非內部數據類型的對象而言,new在創建動態對象的同時完成了初始化工作。如果對象有多個構造函數,那麼new的語句也可以有多種形式。例如
class Obj
{
public :
       Obj(void);                            // 無參數的構造函數
       Obj(int x);                           // 帶一個參數的構造函數
}
void Test(void)
{
       Obj *a = new Obj;
       Obj *b = new Obj(1);         // 初值爲1
      
       delete a;
       delete b;
}
如果用new象數,那只能使用象的無參數構造函數。例如
              Obj *objects = new Obj[100];            // 創建100個動態對象
不能寫成
              Obj *objects = new Obj[100](1);// 創建100個動態對象的同時賦初值1
在用delete象數組時,留意不要了符號[]例如
              delete []objects;      // 正確的用法
delete objects; // 錯誤的用法
後者相當於delete objects[0],漏掉了另外99個對象。
7.12 一些心得體會
我認識不少技術不錯的C++/C程序員,很少有人能拍拍胸脯說通曉指針與內存管理(包括我自己)。我最初學習C語言時特別怕指針,導致我開發第一個應用軟件(約1萬行C代碼)時沒有使用一個指針,全用數組來頂替指針,實在蠢笨得過分。躲避指針不是辦法,後來我改寫了這個軟件,代碼量縮小到原先的一半。
我的經驗教訓是:
(1)越是怕指針,就越要使用指針。不會正確使用指針,肯定算不上是合格的程序員。
(2)必須養成“使用調試器逐步跟蹤程序”的習慣,只有這樣才能發現問題的本質。
 
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章