C/C++堆和棧的知識

(第一課)

一、預備知識—程序的內存分配 

由C/C++編譯的程序佔用的內存分爲以下幾個部分 
1、棧區(stack): 由編譯器自動分配釋放 ,存放函數的參數值,局部變量的值等。其操作方式類似於數據結構中的棧。 
2、堆區(heap): 一般由程序員分配釋放, 若程序員不釋放,程序結束時可能由OS回收。注意它與數據結構中的堆是兩回事,分配方式倒是類似於鏈表。 
3、全局區(static): 全局變量和靜態變量的存儲是放在一塊的,初始化的全局變量和靜態變量在一塊區域, 未初始化的全局變量和未初始化的靜態變量在相鄰的另一塊區域,程序結束後有系統釋放 。 
4、文字常量區: 常量字符串就是放在這裏的, 程序結束後由系統釋放。 
5、程序代碼區: 存放函數體的二進制代碼。 

Example: 

int a = 0; // 全局初始化區 
char *p1; // 全局未初始化區 
main() 

int b; // 棧 
char s[] = "abc"; // 棧 
char *p2; // 棧 
char *p3 = "123456"; // 123456\0在常量區,p3在棧上。 
static int c =0; // 全局(靜態)初始化區 
p1 = (char *)malloc(10); 
p2 = (char *)malloc(20); // 分配得來得10和20字節的區域就在堆區。 
strcpy(p1, "123456"); // 123456\0放在常量區,編譯器可能會將它與p3所指向的"123456"優化成一個地方。 



二、堆和棧的理論知識 

2.1 申請方式 
棧: 由系統自動分配。 例如,聲明在函數中一個局部變量 int b; 系統自動在棧中爲b開闢空間 
堆: 需要程序員自己申請,並指明大小,在c中malloc函數:如p1 = (char *)malloc(10); 在C++中用new運算符 如p2 = (char *)malloc(10); 但是注意p1、p2本身是在棧中的。 

2.2 申請後系統的響應 
棧:只要棧的剩餘空間大於所申請空間,系統將爲程序提供內存,否則將報異常提示棧溢出。 
堆: 首先應該知道操作系統有一個記錄空閒內存地址的鏈表,當系統收到程序的申請時, 會遍歷該鏈表,尋找第一個空間大於所申請空間的堆結點,然後將該結點從空閒結點鏈表中刪除,並將該結點的空間分配給程序,另外,對於大多數系統,會在這塊 內存空間中的首地址處記錄本次分配的大小,這樣,代碼中的delete語句才能正確的釋放本內存空間。另外,由於找到的堆結點的大小不一定正好等於申請的 大小,系統會自動的將多餘的那部分重新放入空閒鏈表中。 

2.3 申請大小的限制 
棧: 在Windows下,棧是向低地址擴展的數據結構,是一塊連續的內存區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的,在 WINDOWS下,棧的大小是2M(也有的說是1M,總之是一個編譯時就確定的常數),如果申請的空間超過棧的剩餘空間時,將提示overflow。因 此,能從棧獲得的空間較小。 
堆:堆是向高地址擴展的數據結構,是不連續的內存區域。這是由於系統是用鏈表來存儲的空閒內存地址的,自然是不連續的,而鏈表的遍歷方向是由低地址向高地址。堆的大小受限於計算機系統中有效的虛擬內存。由此可見,堆獲得的空間比較靈活,也比較大。 

2.4 申請效率的比較: 
棧:由系統自動分配,速度較快。但程序員是無法控制的。 
堆:是由new分配的內存,一般速度比較慢,而且容易產生內存碎片,不過用起來最方便。 
另外,在WINDOWS下,最好的方式是用VirtualAlloc分配內存,他不是在堆,也不是在棧是直接在進程的地址空間中保留一快內存,雖然用起來最不方便。但是速度快,也最靈活。 

2.5 堆和棧中的存儲內容 
棧: 在函數調用時,第一個進棧的是主函數中後的下一條指令(函數調用語句的下一條可執行語句)的地址,然後是函數的各個參數,在大多數的C編譯器中,參數是由 右往左入棧的,然後是函數中的局部變量。注意靜態變量是不入棧的。當本次函數調用結束後,局部變量先出棧,然後是參數,最後棧頂指針指向最開始存的地址, 也就是主函數中的下一條指令,程序由該點繼續運行。 
堆:一般是在堆的頭部用一個字節存放堆的大小。堆中的具體內容有程序員安排。 

2.6 存取效率的比較 
char s1[] = "aaaaaaaaaaaaaaa"; 
char *s2 = "bbbbbbbbbbbbbbbbb"; 
aaaaaaaaaaa是在運行時刻賦值的; 
而bbbbbbbbbbb是在編譯時就確定的; 
但是,在以後的存取中,在棧上的數組比指針所指向的字符串(例如堆)快。 
比如: 
#include 
void main() 

char a = 1; 
char c[] = "1234567890"; 
char *p ="1234567890"; 
a = c[1]; 
a = p[1]; 
return; 

對應的彙編代碼 
10: a = c[1]; 
00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh] 
0040106A 88 4D FC mov byte ptr [ebp-4],cl 
11: a = p[1]; 
0040106D 8B 55 EC mov edx,dword ptr [ebp-14h] 
00401070 8A 42 01 mov al,byte ptr [edx+1] 
00401073 88 45 FC mov byte ptr [ebp-4],al 
第一種在讀取時直接就把字符串中的元素讀到寄存器cl中,而第二種則要先把指針值讀到edx中,在根據edx讀取字符,顯然慢了。 

2.7 小結: 
堆 和棧的區別可以用如下的比喻來看出: 使用棧就象我們去飯館裏吃飯,只管點菜(發出申請)、付錢、和吃(使用),吃飽了就走,不必理會切菜、洗菜等準備工作和洗碗、刷鍋等掃尾工作,他的好處是 快捷,但是自由度小。 使用堆就象是自己動手做喜歡吃的菜餚,比較麻煩,但是比較符合自己的口味,而且自由度大。 

還 有就是函數調用時會在棧上有一系列的保留現場及傳遞參數的操作。棧的空間大小有限定,VC的缺省是2M。棧不夠用的情況一般是程序中分配了大量 數組和遞歸函數層次太深。有一點必須知道,當一個函數調用完返回後它會釋放該函數中所有的棧空間。棧是由編譯器自動管理的,不用你操心。堆是動態分配內存 的,並且你可以分配使用很大的內存。但是用不好會產生內存泄漏。並且頻繁地malloc和free會產生內存碎片(有點類似磁盤碎片),因爲C分配動態內 存時是尋找匹配的內存的。而用棧則不會產生碎片。在棧上存取數據比通過指針在堆上存取數據快些。一般大家說的堆棧和棧是一樣的,就是棧(stack),而 說堆時纔是堆heap。棧是先入後出的,一般是由高地址向低地址生長。

(第二課)


char c; //棧上分配
char *p = new char[3]; //堆上分配,將地址賦給了p;

 

在 編譯器遇到第一條指令時,計算其大小,然後去查找當前棧的空間是大於所需分配的空間大小,如果這時棧內空間大於所申請的空間,那麼就爲其分配內存空間,注 意:在這裏,內在空間的分配是連續的,是接着上次分配結束後進行分配的.如果棧內空間小於所申請的空間大小,那麼這時系統將揭示棧溢出,並給出相應的異常 信息.

編譯器遇到第二條指令時,由於p是在棧上分配的,所以在爲p分配內在空間時和上面的方法一樣,但當遇到new關 鍵字,那麼編譯器都知道,這是用戶申請的動態內存空間,所以就會轉到堆上去爲其尋找空間分配.大家注意:堆上的內存空間不是連續的,它是由相應的鏈表將其 空間區時的內在區塊連接的,所以在接到分配內存空間的指定後,它不會馬上爲其分配相應的空間,而是先要計算所需空間,然後再到遍列整個堆(即遍列整個鏈的 節點),將第一次遇到的內存塊分配給它.最後再把在堆上分配的字符數組的首地址賦給p.,這個時候,大家已經清楚了,p中現在存放的是在堆中申請的字符數組的首地址,也就是在堆中申請的數組的地址現在被賦給了在棧上申請的指針變量p.爲了更加形象的說明問題,請看下圖:

從上圖可以看出,我們在堆上動態分配的數組的首地址存入了指針p所指向的內容.

下面介紹一些例子加深理解:

例一:靜態存儲區與棧區

  char* p = “Hello World1”;

  char a[] = “Hello World2”;

  p[2] =‘A’;

  a[2] =‘A’;

  char* p1 = “Hello World1;”

這 個程序是有錯誤的,錯誤發生在p[2] = ‘A’這行代碼處,爲什麼呢,是變量p和變量數組a都存在於棧區的(任何臨時變量都是處於棧區的,包括在main()函數中定義的變量)。但是,數據 “Hello World1”和數據“Hello World2”是存儲於不同的區域的。

因 爲數據“Hello World2”存在於數組中,所以,此數據存儲於棧區,對它修改是沒有任何問題的。因爲指針變量p僅僅能夠存儲某個存儲空間的地址,數據“Hello World1”爲字符串常量,所以存儲在靜態存儲區。雖然通過p[2]可以訪問到靜態存儲區中的第三個數據單元,即字符‘l’所在的存儲的單元。但是因爲 數據“Hello World1”爲字符串常量,不可以改變,所以在程序運行時,會報告內存錯誤。並且,如果此時對p和p1輸出的時候會發現p和p1裏面保存的地址是完全相 同的。換句話說,在數據區只保留一份相同的數據(見圖1-1)。

例二:棧區與堆區

  char* f1()

  {

  char* p = NULL;

  char a;

  p =

  return p;

  }

  char* f2()

  {

  char* p = NULL:

  p =(char*)new char[4];

  return p;

  }

這 兩個函數都是將某個存儲空間的地址返回,二者有何區別呢?f1()函數雖然返回的是一個存儲空間,但是此空間爲臨時空間。也就是說,此空間只有短暫的生命 週期,它的生命週期在函數f1()調用結束時,也就失去了它的生命價值,即:此空間被釋放掉。所以,當調用f1()函數時,如果程序中有下面的語句:

  char* p;

  p = f1();

  *p =‘a’;

此 時,編譯並不會報告錯誤,但是在程序運行時,會發生異常錯誤。因爲,你對不應該操作的內存(即,已經釋放掉的存儲空間)進行了操作。但是,相比之 下,f2()函數不會有任何問題。因爲,new這個命令是在堆中申請存儲空間,一旦申請成功,除非你將其delete或者程序終結,這塊內存將一直存在。 也可以這樣理解,堆內存是共享單元,能夠被多個函數共同訪問。如果你需要有多個數據返回卻苦無辦法,堆內存將是一個很好的選擇。但是一定要避免下面的事情 發生:

  void f()

  {

  …

  char * p;

  p =(char*)new char[100];

  …

  }

這 個程序做了一件很無意義並且會帶來很大危害的事情。因爲,雖然申請了堆內存,p保存了堆內存的首地址。但是,此變量是臨時變量,當函數調用結束時p變量消 失。也就是說,再也沒有變量存儲這塊堆內存的首地址,我們將永遠無法再使用那塊堆內存了。但是,這塊堆內存卻一直標識被你所使用(因爲沒有到程序結束,你 也沒有將其delete,所以這塊堆內存一直被標識擁有者是當前您的程序),進而其他進程或程序無法使用。我們將這種不道德的“流氓行爲”(我們不用,卻 也不讓別人使用)稱爲內存泄漏。這是我們C++程序員的大忌!!請大家一定要避免這件事情的發生。

總 之,對於堆區、棧區和靜態存儲區它們之間最大的不同在於,棧的生命週期很短暫。但是堆區和靜態存儲區的生命週期相當於與程序的生命同時存在(如果您不在程 序運行中間將堆內存delete的話),我們將這種變量或數據成爲全局變量或數據。但是,對於堆區的內存空間使用更加靈活,因爲它允許你在不需要它的時 候,隨時將它釋放掉,而靜態存儲區將一直存在於程序的整個生命週期中。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章