內存越界分析與解決辦法——20110707

1. 原理分析
經常有些新C++程序員問:C++的類的成員個數是不是有限制,爲什麼我加一個變量後程序就死了?或者說:是不是成員變量的順序很重要,爲什麼我兩個成員變量順序換一換程序就不行了?凡此種種之怪現象,往往都是內存訪問越界所致。

何謂內存訪問越界,簡單的說,你向系統申請了一塊內存,在使用這塊內存的時候,超出了你申請的範圍。例如,你明明申請的是100字節的空間,但是你由於某種原因寫入了120字節,這就是內存訪問越界。內存訪問越界的後果是:你的寫入破壞了本不屬於你的空間。

下面是一個簡單的例子:
int a;
char b[16]="abcd";
int c;

a = 1;
c = 2;
printf("a=%d,c=%d\n", a,c);
memset(b, 0,32); //注意這裏訪問越界了,你只有16字節空間,卻修改了32字節
printf("a=%d,c=%d\n", a,c);

你可以看出,在memset前後,兩個printf語句打印出來的值並不一樣,因爲memset越界後修改了a或者c的值(由於不同編譯器對變量在空間中順序的安排可能有不同策略,因此我用兩個變量,希望能抓到越界信息。對於VC,debug模式下系統添加了很多填充字節,你可能需要增加越界的數量才能看到效果)


2. 爲什麼增加一個變量後程序就崩潰了?
增加一個變量後,內存中變量的佈局也發生了變化。如果一個內存越界破壞了一個不含指針的結構,程序雖然邏輯不對,但是不至於崩潰。但是如果增加變量後,內存訪問越界破壞了一個指針,則會導致程序崩潰。

例如:

int a;
char b[128];
//bool c;
char* d=new char[128];
int e;

b[136] = '\0';
b[137] = '\0';
b[138] = '\0';
b[139] = '\0';
strcpy(d, "haha");
注意, b訪問越界了8個字節位置處的4個字節。如果沒有c,那麼越界破壞了e變量,不會導致程序崩潰。但是加上c之後,破壞的變量可能就是d了,由於指針被破壞後,一旦訪問就是內存訪問違例,導致程序崩潰。

這也解釋了爲什麼交換順序會導致程序崩潰。如果上面情況沒有變量c,你交換e和d,結構也是類似的,程序也一樣要崩潰。

3. 爲什麼有些情況越界了程序也沒錯?
這主要是說這個話的人對什麼是“錯”沒有正確的認識。程序不是隻有崩潰了纔是錯!你破壞了別的變量,那個變量總有被使用的時候,儘管那個變量不會導致諸如程序崩潰、報警之類的嚴重錯誤,但是其計算結果必然是錯誤的。你說“程序沒錯”,是因爲你根本沒有發現錯誤而已。這種情況甚至比程序直接崩潰還要惡劣,因爲程序一旦崩潰你肯定會去查,可以在導致真正嚴重的問題之前就把問題解決了。而如果計算錯誤隱藏到很晚,你的損失就可能很大了。(例如,一顆衛星上天了,你才發現一臺儀器由於軟件故障無法測量真正的數據,那得多少損失?)

4. 如何解決內存訪問越界問題?
老實說沒有好的方法。遇到這種問題,首先你得找到哪裏有內存訪問越界,而一個比較麻煩得問題在於,出現錯誤得地方往往不是真正內存越界得地方。對於內存訪問越界,往往需要進行仔細得代碼走查、單步跟蹤並觀察變量以及在調試環境得幫助下對變量進行寫入跟蹤(如VC6就有一旦變量被修改就break得機制)。

更重要得是,程序員要養成良好的編程習慣,在修改每個數組時一定要對這個數組有多少空間有清醒的認識,否則一旦出錯,找到原因是很痛苦的事情。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章