內存越界分析與解決辦法——20110707

原創

2020-06-26 04:07

1. 原理分析
經常有些新C＋＋程序員問：C＋＋的類的成員個數是不是有限制，爲什麼我加一個變量後程序就死了？或者說：是不是成員變量的順序很重要，爲什麼我兩個成員變量順序換一換程序就不行了？凡此種種之怪現象，往往都是內存訪問越界所致。

何謂內存訪問越界，簡單的說，你向系統申請了一塊內存，在使用這塊內存的時候，超出了你申請的範圍。例如，你明明申請的是100字節的空間，但是你由於某種原因寫入了120字節，這就是內存訪問越界。內存訪問越界的後果是：你的寫入破壞了本不屬於你的空間。

下面是一個簡單的例子：
int a;
char b[16]="abcd";
int c;

a = 1;
c = 2;
printf("a=%d,c=%d\n", a,c);
memset(b, 0,32); //注意這裏訪問越界了，你只有16字節空間，卻修改了32字節
printf("a=%d,c=%d\n", a,c);

你可以看出，在memset前後，兩個printf語句打印出來的值並不一樣，因爲memset越界後修改了a或者c的值（由於不同編譯器對變量在空間中順序的安排可能有不同策略，因此我用兩個變量，希望能抓到越界信息。對於VC，debug模式下系統添加了很多填充字節，你可能需要增加越界的數量才能看到效果）

2. 爲什麼增加一個變量後程序就崩潰了？
增加一個變量後，內存中變量的佈局也發生了變化。如果一個內存越界破壞了一個不含指針的結構，程序雖然邏輯不對，但是不至於崩潰。但是如果增加變量後，內存訪問越界破壞了一個指針，則會導致程序崩潰。

例如：

int a;
char b[128];
//bool c;
char* d=new char[128];
int e;

b[136] = '\0';
b[137] = '\0';
b[138] = '\0';
b[139] = '\0';
strcpy(d, "haha");
注意, b訪問越界了8個字節位置處的4個字節。如果沒有c，那麼越界破壞了e變量，不會導致程序崩潰。但是加上c之後，破壞的變量可能就是d了，由於指針被破壞後，一旦訪問就是內存訪問違例，導致程序崩潰。

這也解釋了爲什麼交換順序會導致程序崩潰。如果上面情況沒有變量c，你交換e和d，結構也是類似的，程序也一樣要崩潰。

3. 爲什麼有些情況越界了程序也沒錯？
這主要是說這個話的人對什麼是“錯”沒有正確的認識。程序不是隻有崩潰了纔是錯！你破壞了別的變量，那個變量總有被使用的時候，儘管那個變量不會導致諸如程序崩潰、報警之類的嚴重錯誤，但是其計算結果必然是錯誤的。你說“程序沒錯”，是因爲你根本沒有發現錯誤而已。這種情況甚至比程序直接崩潰還要惡劣，因爲程序一旦崩潰你肯定會去查，可以在導致真正嚴重的問題之前就把問題解決了。而如果計算錯誤隱藏到很晚，你的損失就可能很大了。（例如，一顆衛星上天了，你才發現一臺儀器由於軟件故障無法測量真正的數據，那得多少損失？）

4. 如何解決內存訪問越界問題？
老實說沒有好的方法。遇到這種問題，首先你得找到哪裏有內存訪問越界，而一個比較麻煩得問題在於，出現錯誤得地方往往不是真正內存越界得地方。對於內存訪問越界，往往需要進行仔細得代碼走查、單步跟蹤並觀察變量以及在調試環境得幫助下對變量進行寫入跟蹤（如VC6就有一旦變量被修改就break得機制）。

更重要得是，程序員要養成良好的編程習慣，在修改每個數組時一定要對這個數組有多少空間有清醒的認識，否則一旦出錯，找到原因是很痛苦的事情。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

內存越界分析與解決辦法——20110707

Source Insight快捷鍵大全——20110421

MySQL中char、varchar和text的區別——20110413

C/C++ union用法——20110531

MFC刪除文件夾代碼——20110728

Vi常用命令解析——20110902

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結