(轉)C++堆、棧、自由存儲區、全局/靜態存儲區和常量存儲區

(轉)http://blog.csdn.net/jsjwql/archive/2007/09/10/1779516.aspx

堆: 操作系統有一個記錄空閒內存地址的鏈表,當系統收到程序的申請時,會遍歷該鏈表,尋找第一個空間大於所申請空間的堆結點,然後將該結點從空閒結點鏈表中刪 除,並將該結點的空間分配給程序,另外,對於大多數系統,會在這塊內存空間中的首地址處記錄本次分配的大小,這樣代碼 中的delete語句才能正確的釋放本內存空間。我們常說的內存泄露,最常見的就是堆泄露(還有資源泄露),它是指程序在運行中出現泄露,如果程序被關閉掉的話,操作系統會幫助釋放泄露的內存。

棧:在函數調用時第一個進棧的主函數中的下一條指令(函數調用語句的下一條可執行語句)的地址然後是函數 的各個參數,在大多數的C編譯器中,參數是由右往左入棧,然後是函數中的局部變量。

 

一、預備知識程序的內存分配

一個由c/C++編譯的程序佔用的內存分爲以下幾個部分

1、棧區(stack由編譯器自動分配釋放 ,存放函數的參數值,局部變量的值等。其操作方式類似於數據結構中的棧。

2、堆區(heap一般由程序員分配釋放, 若程序員不釋放,程序結束時可能由OS回收 。注意它與數據結構中的堆是兩回事,分配方式倒是類似於鏈表,呵呵。

3、全局區(靜態區)(static,全局變量和靜態變量的存儲是放在一塊的,初始化的全局變量和靜態變量在一塊區域, 未初始化的全局變量和未初始化的靜態變量在相鄰的另一塊區域。 - 程序結束後有系統釋放

4、文字常量區常量字符串就是放在這裏的。 程序結束後由系統釋放

5、程序代碼區存放函數體的二進制代碼。

 

有些說法,把34合在一起,也有的把3分成自由存儲區(malloc/free)和全局/靜態存儲區。

這與編譯器和操作系統有關。

 

二、例子程序

這是一個前輩寫的,非常詳細

//main.cpp

int a = 0; 全局初始化區

char *p1; 全局未初始化區

main()

{

int b;

char s[] = "abc"; //更正:abc 分配在靜態存儲區,不是棧上

char *p2;

char *p3 = "123456"; 123456\0在常量區,p3在棧上。

static int c =0 全局(靜態)初始化區

p1 = (char *)malloc(10);

p2 = (char *)malloc(20);

分配得來得1020字節的區域就在堆區。

strcpy(p1, "123456"); 123456\0放在常量區,編譯器可能會將它與p3所指向的"123456"優化成一個地方。

}

二、堆和棧的理論知識

2.1申請方式

stack:

由系統自動分配。 例如,聲明在函數中一個局部變量 int b; 系統自動在棧中爲b開闢空間

heap:

需要程序員自己申請,並指明大小,在cmalloc函數

p1 = (char *)malloc(10);

C++中用new運算符

p2 = (char *)malloc(10);

但是注意p1p2本身是在棧中的。

2.2

申請後系統的響應

棧:只要棧的剩餘空間大於所申請空間,系統將爲程序提供內存,否則將報異常提示棧溢出。

堆:首先應該知道操作系統有一個記錄空閒內存地址的鏈表,當系統收到程序的申請時,

遍歷該鏈表,尋找第一個空間大於所申請空間的堆結點,然後將該結點從空閒結點鏈表中刪除,並將該結點的空間分配給程序,另外,對於大多數系統,會在這塊內 存空間中的首地址處記錄本次分配的大小,這樣,代碼中的delete語句才能正確的釋放本內存空間。另外,由於找到的堆結點的大小不一定正好等於申請的大 小,系統會自動的將多餘的那部分重新放入空閒鏈表中。

2.3申請大小的限制

棧:在Windows,棧是向低地址擴展的數據結構,是 一塊連續的內存的區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的,在 WINDOWS下,棧的大小是2M(也有的說是1M,總之是一個 編譯時就確定的常數),如果申請的空間超過棧的剩餘空間時,將提示overflow。因此,能從棧獲得的空間較小。

堆:堆是向高地址擴展的數據結構,是不連續的內存區域。這是由於系統是用鏈表來存儲的空閒內存地址的,自然是不連續的,而鏈表的遍歷方向是由低地址向高地址。堆的大小受限於計算機系統中有效的虛擬內存。由此可見,堆獲得的空間比較靈活,也比較大。

2.4申請效率的比較:

棧由系統自動分配,速度較快。但程序員是無法控制的。

堆是由new分配的內存,一般速度比較慢,而且容易產生內存碎片,不過用起來最方便.

另外,在WINDOWS下,最好的方式是用VirtualAlloc分配內存,他不是在堆,也不是在棧是直接在進程的地址空間中保留一快內存,雖然用起來最不方便。但是速度快,也最靈活

2.5堆和棧中的存儲內容

棧: 在函數調用時,第一個進棧的是主函數的下一條指令(函數調用語句的下一條可執行語句)的地址,然後是函數的各個參數,在大多數的C編譯器中,參數是由右往左入棧的,然後是函數中的局部變量。注意靜態變量是不入棧的。

當本次函數調用結束後,局部變量先出棧,然後是參數,最後棧頂指針指向最開始存的地址,也就是主函數中的下一條指令,程序由該點繼續運行。

堆:一般是在堆的頭部用一個字節存放堆的大小。堆中的具體內容有程序員安排。

2.6存取效率的比較

 

char s1[] = "aaaaaaaaaaaaaaa";

char *s2 = "bbbbbbbbbbbbbbbbb";

aaaaaaaaaaa是在運行時刻賦值的;

bbbbbbbbbbb是在編譯時就確定的;

但是,在以後的存取中,在棧上的數組比指針所指向的字符串(例如堆)快。

比如:

i nclude

void main()

{

char a = 1;

char c[] = "1234567890";

char *p ="1234567890";

a = c[1];

a = p[1];

return;

}

對應的彙編代碼

10: a = c[1];

00401067 8A 4D F1 mov cl,byte ptr [ebp-0Fh]

0040106A 88 4D FC mov byte ptr [ebp-4],cl

11: a = p[1];

0040106D 8B 55 EC mov edx,dword ptr [ebp-14h]

00401070 8A 42 01 mov al,byte ptr [edx+1]

00401073 88 45 FC mov byte ptr [ebp-4],al

第一種在讀取時直接就把字符串中的元素讀到寄存器cl中,而第二種則要先把指針值讀到edx中,在根據edx讀取字符,顯然慢了。

 

2.7小結:

堆和棧的區別可以用如下的比喻來看出:

使用棧就象我們去飯館裏吃飯,只管點菜(發出申請)、付錢、和吃(使用),吃飽了就走,不必理會切菜、洗菜等準備工作和洗碗、刷鍋等掃尾工作,他的好處是快捷,但是自由度小。

使用堆就象是自己動手做喜歡吃的菜餚,比較麻煩,但是比較符合自己的口味,而且自由度大。


1、內存分配方面:

    堆:一般由程序員分配釋放, 若程序員不釋放,程序結束時可能由OS回收 。注意它與數據結構中的堆是兩回事,分配方式是類似於鏈表。可能用到的關鍵字如下:new、malloc、delete、free等等。

    棧:由編譯器(Compiler)自動分配釋放,存放函數的參數值,局部變量的值等。其操作方式類似於數據結構中的棧。

2、申請方式方面:

    堆:需要程序員自己申請,並指明大小。在c中malloc函數如p1 = (char *)malloc(10);在C++中用new運算符,但是注意p1、p2本身是在棧中的。因爲他們還是可以認爲是局部變量。

    棧:由系統自動分配。 例如,聲明在函數中一個局部變量 int b;系統自動在棧中爲b開闢空間。

3、系統響應方面:

    堆:操作系統有一個記錄空閒內存地址的鏈表,當系統收到程序的申請時,會遍歷該鏈表,尋找第一個空間大於所申請空間的堆結點,然後將該結點從空閒結點鏈表中刪除,並將該結點的空間分配給程序,另外,對於大多數系統,會在這塊內存空間中的首地址處記錄本次分配的大小,這樣代碼中的delete語句才能正確的釋放本內存空間。另外由於找到的堆結點的大小不一定正好等於申請的大小,系統會自動的將多餘的那部分重新放入空閒鏈表中。

    棧:只要棧的剩餘空間大於所申請空間,系統將爲程序提供內存,否則將報異常提示棧溢出。

4、大小限制方面:

    堆:是向高地址擴展的數據結構,是不連續的內存區域。這是由於系統是用鏈表來存儲的空閒內存地址的,自然是不連續的,而鏈表的遍歷方向是由低地址向高地址。堆的大小受限於計算機系統中有效的虛擬內存。由此可見,堆獲得的空間比較靈活,也比較大。

    棧:在Windows下, 棧是向低地址擴展的數據結構,是一塊連續的內存的區域。這句話的意思是棧頂的地址和棧的最大容量是系統預先規定好的,在WINDOWS下,棧的大小是固定的(是一個編譯時就確定的常數),如果申請的空間超過棧的剩餘空間時,將提示overflow。因此,能從棧獲得的空間較小。

5、效率方面:

    堆:是由new分配的內存,一般速度比較慢,而且容易產生內存碎片,不過用起來最方便,另外,在WINDOWS下,最好的方式是用VirtualAlloc分配內存,他不是在堆,也不是在棧是直接在進程的地址空間中保留一快內存,雖然用起來最不方便。但是速度快,也最靈活。

    棧:由系統自動分配,速度較快。但程序員是無法控制的。

6、存放內容方面:

    堆:一般是在堆的頭部用一個字節存放堆的大小。堆中的具體內容有程序員安排。

    棧:在函數調用時第一個進棧的是主函數中後的下一條指令(函數調用語句的下一條可執行語句)的地址然後是函數的各個參數,在大多數的C編譯器中,參數是由右往左入棧,然後是函數中的局部變量。 注意: 靜態變量是不入棧的。當本次函數調用結束後,局部變量先出棧,然後是參數,最後棧頂指針指向最開始存的地址,也就是主函數中的下一條指令,程序由該點繼續運行。

7、存取效率方面:

    堆:char *s1 = "Hellow Word";是在編譯時就確定的;

    棧:char s1[] = "Hellow Word"; 是在運行時賦值的;用數組比用指針速度要快一些,因爲指針在底層彙編中需要用edx寄存器中轉一下,而數組在棧上直接讀取。


 

堆和棧的區別主要分:

操作系統方面的堆和棧,如上面說的那些,不多說了。

還有就是數據結構方面的堆和棧,這些都是不同的概念。這裏的堆實際上指的就是(滿足堆性質的)優先隊列的一種數據結構,第1個元素有最高的優先權;棧實際上就是滿足先進後出的性質的數學或數據結構。

雖然堆棧,堆棧的說法是連起來叫,但是他們還是有很大區別的,連着叫只是由於歷史的原因。

 

2.8 補充知識: 

(heap)和棧(stack)C/C++編程不可避免會碰到的兩個基本概念。首先,這兩個概念都可以在講數據結構的書中找到,他們都是基本的數據結構,雖然棧更爲簡單一些。

在具體的C/C++編程框架中,這兩個概念並不是並行的。對底層機器代碼的研究可以揭示,棧是機器系統提供的數據結構,而堆則是C/C++函數庫提供的。

體地說,現代計算機(串行執行機制),都直接在代碼底層支持棧的數據結構。這體現在,有專門的寄存器指向棧所在的地址,有專門的機器指令完成數據入棧出棧 的操作。這種機制的特點是效率高,支持的數據有限,一般是整數,指針,浮點數等系統直接支持的數據類型,並不直接支持其他的數據結構。因爲棧的這種特點, 對棧的使用在程序中是非常頻繁的。對子程序的調用就是直接利用棧完成的。機器的call指令裏隱含了把返回地址推入棧,然後跳轉至子程序地址的操作,而子 程序中的ret指令則隱含從堆棧中彈出返回地址並跳轉之的操作。C/C++中的自動變量是直接利用棧的例子,這也就是爲什麼當函數返回時,該函數的自動變 量自動失效的原因(因爲堆棧恢復了調用前的狀態)

和棧不同,堆的數據結構並不是由系統(無論是機器系統還是操作系統)支持的,而是由函數 庫提供的。基本的malloc/realloc/free函數維護了一套內部的堆數據結構。當程序使用這些函數去獲得新的內存空間時,這套函數首先試圖從 內部堆中尋找可用的內存空間,如果沒有可以使用的內存空間,則試圖利用系統調用來動態增加程序數據段的內存大小,新分配得到的空間首先被組織進內部堆中 去,然後再以適當的形式返回給調用者。當程序釋放分配的內存空間時,這片內存空間被返回內部堆結構中,可能會被適當的處理(比如和其他空閒空間合併成更大 的空閒空間),以更適合下一次內存分配申請。這套複雜的分配機制實際上相當於一個內存分配的緩衝池(Cache),使用這套機制有如下若干原因:

1. 系統調用可能不支持任意大小的內存分配。有些系統的系統調用只支持固定大小及其倍數的內存請求(按頁分配);這樣的話對於大量的小內存分類來說會造成浪費。

2. 系統調用申請內存可能是代價昂貴的。系統調用可能涉及用戶態和核心態的轉換。

3. 沒有管理的內存分配在大量複雜內存的分配釋放操作下很容易造成內存碎片。

堆和棧的對比

以上知識可知,棧是系統提供的功能,特點是快速高效,缺點是有限制,數據不靈活;而堆是函數庫提供的功能,特點是靈活方便,數據適應面廣泛,但是效率有一 定降低。棧是系統數據結構,對於進程/線程是唯一的;堆是函數庫內部數據結構,不一定唯一。不同堆分配的內存邏輯上無法互相操作。棧空間分靜態分配和動態 分配兩種。靜態分配是編譯器完成的,比如自動變量(auto)的分配。動態分配由alloca函數完成。棧的動態分配無需釋放(是自動的),也就沒有釋放 函數。爲可移植的程序起見,棧的動態分配操作是不被鼓勵的!堆空間的分配總是動態的,雖然程序結束時所有的數據空間都會被釋放回系統,但是精確的申請內存 /釋放內存匹配是良好程序的基本要素。

堆和棧究竟有什麼區別?

    主要的區別由以下幾點:

    1、管理方式不同;

    2、空間大小不同;

    3、能否產生碎片不同;

    4、生長方向不同;

    5、分配方式不同;

    6、分配效率不同;

    管理方式:對於棧來講,是由編譯器自動管理,無需我們手工控制;對於堆來說,釋放工作由程序員控制,容易產生memory leak

    空間大小:一般來講在32位系統下,堆內存可以達到4G的空間,從這個角度來看堆內存幾乎是沒有什麼限制的。但是對於棧來講,一般都是有一定的空間大小的,例如,在VC6下面,默認的棧空間大小是1M(好像是,記不清楚了)。當然,我們可以修改:   

    打開工程,依次操作菜單如下:Project->Setting->Link,在Category 中選中Output,然後在Reserve中設定堆棧的最大值和commit

注意:reserve最小值爲4Bytecommit是保留在虛擬內存的頁文件裏面,它設置的較大會使棧開闢較大的值,可能增加內存的開銷和啓動時間。

    碎片問題:對於堆來講,頻繁的new/delete勢必會造成內存空間的不連續,從而造成大量的碎片,使程序效率降低。對於棧來講,則不會存在這個問題, 因爲棧是先進後出的隊列,他們是如此的一一對應,以至於永遠都不可能有一個內存塊從棧中間彈出,在他彈出之前,在他上面的後進的棧內容已經被彈出,詳細的 可以參考數據結構,這裏我們就不再一一討論了。

    生長方向:對於堆來講,生長方向是向上的,也就是向着內存地址增加的方向;對於棧來講,它的生長方向是向下的,是向着內存地址減小的方向增長。

    分配方式:堆都是動態分配的,沒有靜態分配的堆。棧有2種分配方式:靜態分配和動態分配。靜態分配是編譯器完成的,比如局部變量的分配。動態分配由alloca函數進行分配,但是棧的動態分配和堆是不同的,他的動態分配是由編譯器進行釋放,無需我們手工實現。

    分配效率:棧是機器系統提供的數據結構,計算機會在底層對棧提供支持:分配專門的寄存器存放棧的地址,壓棧出棧都有專門的指令執行,這就決定了棧的效率比 較高。堆則是C/C++函數庫提供的,它的機制是很複雜的,例如爲了分配一塊內存,庫函數會按照一定的算法(具體的算法可以參考數據結構/操作系統)在堆 內存中搜索可用的足夠大小的空間,如果沒有足夠大小的空間(可能是由於內存碎片太多),就有可能調用系統功能去增加程序數據段的內存空間,這樣就有機會分 到足夠大小的內存,然後進行返回。顯然,堆的效率比棧要低得多。

    從這裏我們可以看到,堆和棧相比,由於大量new/delete的使用,容易造成大量的內存碎片;由於沒有專門的系統支持,效率很低;由於可能引發用戶態 和核心態的切換,內存的申請,代價變得更加昂貴。所以棧在程序中是應用最廣泛的,就算是函數的調用也利用棧去完成,函數調用過程中的參數,返回地址, EBP和局部變量都採用棧的方式存放。所以,我們推薦大家儘量用棧,而不是用堆。

    雖然棧有如此衆多的好處,但是由於和堆相比不是那麼靈活,有時候分配大量的內存空間,還是用堆好一些。

    無論是堆還是棧,都要防止越界現象的發生(除非你是故意使其越界),因爲越界的結果要麼是程序崩潰,要麼是摧毀程序的堆、棧結構,產生以想不到的結果, 算是在你的程序運行過程中,沒有發生上面的問題,你還是要小心,說不定什麼時候就崩掉,那時候debug可是相當困難的:)

    對了,還有一件事,如果有人把堆棧合起來說,那它的意思是棧,可不是堆,呵呵,清楚了?

棧到底是什麼東西

MSDN中關於Thread   Stack   Size有這麼一段話:        

Platform   SDK:   DLLs,   Processes,   and   Threads    

Thread   Stack   Size     

Each   new   thread   receives   its   own   stack   space,   consisting   of   both   committed   and   reserved   memory.   The   system   will   commit   one   page   blocks   from   the   reserved   stack   memory   as   needed,   until   the   stack  cannot   grow   any   farther.  

The   default   size   for   committed   and   reserved   memory   is   specified   in   the   executable   file   header.   The   default   reserved   memory   is   one   megabyte.   To   specify   a   different   default   stack   size,   use   the   STACKSIZE   statement   in   the   module   definition   (.DEF)   file.   Your   linker   may   also   support   a   command-line   option   for   setting   the   stack   size.   For   more   information,   see   the   documentation   included   with   your   linker.    

Threads   that   call   the   C   run-time   library   or   the   Windows   API   must   allow   sufficient   stack   space   for   use   of   these   functions.   Do   not   lower   the   reserved   stack  size   below   64   KB.      

To   increase   the   amount   of   stack   space   which   is   to   be   initially   committed   for   a   thread,   specify   the   value   in   the   dwStackSize   parameter   of   the   CreateThread   or   CreateRemoteThread   function.   This   value   is   rounded   to   the   nearest   page.   The   call   to   create   the   thread   fails   if   there   is   not   enough   memory   to   commit   or   reserve   the   number   of   bytes   requested.   If   dwStackSize   is   smaller   than   the   default   reserve   size,   the   new   thread   uses   the   default   reserve   size.   If   dwStackSize   is   larger   than   the   default   reserve   size,   the   reserve   size   is   rounded   up   to   the   nearest   multiple   of   1   MB.  

Windows   Server   2003   and   Windows   XP:     If   the   dwCreationFlags   parameter   of   CreateThread   or   CreateRemoteThread   is   STACK_SIZE_PARAM_IS_A_RESERVATION,   the   dwStackSize   parameter   specifies   the   amount   of   stack   space   which   is   to   be   initially   reserved   for   the   thread.    

The   stack   is   freed   when   the   thread   terminates.

 

Reference:

http://blog.csdn.net/fondiyass007/archive/2007/06/13/1650683.aspx

http://blog.csdn.net/szs1860/archive/2007/05/12/1606192.aspx
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章