C#內存分配概念

在C#中,內存分成5個區,他們分別是堆、棧、自由存儲區、全局/靜態存儲區和常量存儲區。


棧,就是那些由編譯器在需要的時候分配,在不需要的時候自動清楚的變量的存儲區。裏面的變量通常是局部變量、函數參數等。


堆,就是那些由new分配的內存塊,他們的釋放編譯器不去管,由我們的應用程序去控制,一般一個new就要對應一個delete。如果程序員沒有釋放掉,那麼在程序結束後,操作系統會自動回收。


自由存儲區,就是那些由malloc等分配的內存塊,他和堆是十分相似的,不過它是用free來結束自己的生命的。

 
全局/靜態存儲區,全局變量和靜態變量被分配到同一塊內存中,在以前的C語言中,全局變量又分爲初始化的和未初始化的,在C++裏面沒有這個區分了,他們共同佔用同一塊內存區。


常量存儲區,這是一塊比較特殊的存儲區,他們裏面存放的是常量,不允許修改(當然,你要通過非正當手段也可以修改,而且方法很多) 

明確區分堆與棧 
在bbs上,堆與棧的區分問題,似乎是一個永恆的話題,由此可見,初學者對此往往是混淆不清的,所以我決定拿他第一個開刀。 
首先,我們舉一個例子:


void f() { int* p=new int[5]; }


這條短短的一句話就包含了堆與棧,看到new,我們首先就應該想到,我們分配了一塊堆內存,那麼指針p呢?他分配的是一塊棧內存,所以這句話的意思就是:在棧內存中存放了一個指向一塊堆內存的指針p。在程序會先確定在堆中分配內存的大小,然後調用operator new分配內存,然後返回這塊內存的首地址,放入棧中,他在VC6下的彙編代碼如下:


00401028 push 14h                                       
0040102A call operator new (00401060) 
0040102F add esp,4                                      
00401032 mov dword ptr [ebp-8],eax   
00401035 mov eax,dword ptr [ebp-8]   
00401038 mov dword ptr [ebp-4],eax    


這裏,我們爲了簡單並沒有釋放內存,那麼該怎麼去釋放呢?是delete p麼?澳,錯了,應該是delete []p,這是爲了告訴編譯器:我刪除的是一個數組,VC6就會根據相應的Cookie信息去進行釋放內存的工作。


好了,我們回到我們的主題:堆和棧究竟有什麼區別? 
主要的區別由以下幾點:

 

l  管理方式:對於棧來講,是由編譯器自動管理,無需我們手工控制;對於堆來說,釋放工作由程序員控制,容易產生memory leak。 
 

l  空間大小:一般來講在32位系統下,堆內存可以達到4G的空間,從這個角度來看堆內存幾乎是沒有什麼限制的。但是對於棧來講,一般都是有一定的空間大小的,例如,在VC6下面,默認的棧空間大小是1M(好像是,記不清楚了)。當然,我們可以修改: 
打開工程,依次操作菜單如下:Project->Setting->Link,在Category 中選中Output,然後在Reserve中設定堆棧的最大值和commit。 
注意:reserve最小值爲4Byte;commit是保留在虛擬內存的頁文件裏面,它設置的較大會使棧開闢較大的值,可能增加內存的開銷和啓動時間。 
碎片問題:對於堆來講,頻繁的new/delete勢必會造成內存空間的不連續,從而造成大量的碎片,使程序效率降低。對於棧來講,則不會存在這個問題,因爲棧是先進後出的隊列,他們是如此的一一對應,以至於永遠都不可能有一個內存塊從棧中間彈出,在他彈出之前,在他上面的後進的棧內容已經被彈出,詳細的可以參考數據結構,這裏我們就不再一一討論了。

 

l  生長方向:對於堆來講,生長方向是向上的,也就是向着內存地址增加的方向;對於棧來講,它的生長方向是向下的,是向着內存地址減小的方向增長。 
 

l  分配方式:堆都是動態分配的,沒有靜態分配的堆。棧有2種分配方式:靜態分配和動態分配。靜態分配是編譯器完成的,比如局部變量的分配。動態分配由alloca函數進行分配,但是棧的動態分配和堆是不同的,他的動態分配是由編譯器進行釋放,無需我們手工實現。
 

 l  分配效率:棧是機器系統提供的數據結構,計算機會在底層對棧提供支持:分配專門的寄存器存放棧的地址,壓棧出棧都有專門的指令執行,這就決定了棧的效率比較高。堆則是C/C++函數庫提供的,它的機制是很複雜的,例如爲了分配一塊內存,庫函數會按照一定的算法(具體的算法可以參考數據結構/操作系統)在堆內存中搜索可用的足夠大小的空間,如果沒有足夠大小的空間(可能是由於內存碎片太多),就有可能調用系統功能去增加程序數據段的內存空間,這樣就有機會分到足夠大小的內存,然後進行返回。顯然,堆的效率比棧要低得多。 
 

  從這裏我們可以看到,堆和棧相比,由於大量new/delete的使用,容易造成大量的內存碎片;由於沒有專門的系統支持,效率很低;由於可能引發用戶態和核心態的切換,內存的申請,代價變得更加昂貴。所以棧在程序中是應用最廣泛的,就算是函數的調用也利用棧去完成,函數調用過程中的參數,返回地址,EBP和局部變量都採用棧的方式存放。所以,我們推薦大家儘量用棧,而不是用堆。 
  雖然棧有如此衆多的好處,但是由於和堆相比不是那麼靈活,有時候分配大量的內存空間,還是用堆好一些。 
  無論是堆還是棧,都要防止越界現象的發生(除非你是故意使其越界),因爲越界的結果要麼是程序崩潰,要麼是摧毀程序的堆、棧結 構,產生以想不到的結果,就算是在你的程序運行過程中,沒有發生上面的問題,你還是要小心,說不定什麼時候就崩掉,那時候debug可是相當困難的:).

 

C#的內存分類
由於C#是一種託管語言,它的垃圾回收機制(GC)是由.net平臺負責的,加之C#語言並沒有指針,所以我們在使用過程中極少會考慮到內存使用狀況以及項目在運行過程中是如何進行內存管理的。但是,C#只是在內存管理方面對程序員隱藏了,並不代表它不涉及這些東西,甚至其內部內存管理或許比自己手動管理更加複雜。

參考前面文章中的內存分類——四分類,本文會依據自己的理解,從這四個分類來說明。

1、代碼區

 

2、線程棧  

C#程序在程序運行的時候,每個線程(Thread)都會維護一個自己的專屬線程堆棧。此即爲“棧”,或者稱之爲“線程棧”

值類型存儲在線程棧。棧由操作系統進行管理,不受GC管理,當值類型不在其作用域(主要是指其所在函數內)時,其所佔棧空間自動釋放。棧的執行效率是非常高的。

3、託管堆

當CLR載入內存之後,會初始化兩個託管堆,

一個大對象堆(LOH –large object heap)
一個小對象對(SOH – small object heap)
GC堆

(1)小對象堆(SOH)

對於SOH,對象在執行一次垃圾回收之後,會進入到下一代。也就是說如果在第一次執行垃圾回收時,存活下來的對象會進入第1代,如果在第2次垃圾回收之後該對象仍然沒有被當作垃圾回收掉,它就會成爲2代對象;2代對象就是最老的對象不會在提升代數。從代的角度看,大對象屬於2代對象,因爲只有在2代回收時纔會處理大對象。

(2)大對象堆(LOH)
用於分配大對象實例。大對象就是大小大於85000字節(約爲83k)的實例對象。大對象分配在LOH上,不受GC控制,不會被壓縮,只有在完全GC回收(只有在2代回收時纔會處理大對象)時纔會被回收。

(3)GC堆
用於分配小對象實例。所謂小對象就是大小小於85000字節(約爲83k)的實例對象。GC堆分三代垃圾進行管理,當進行GC操作(垃圾回收)時,垃圾收集器會對GC堆進行壓縮回收。

 

4、全局數據區

 

       全局變量、常量、靜態類和靜態成員(靜態變量、靜態方法),都存放在全局區,而它們的地址放在聲明時變量(在代碼區)開闢在棧區的內存中。(這些地址都是在程序運行時最先壓棧的,這點很重要)

       全局變量和靜態類、常量、靜態成員,都是在全局區,但是它們的地址仍放在棧區,爲什麼會保存住呢?因爲在.net程序編譯時這些靜態和全局都是最先編譯的,所以最先壓棧,那麼也就只能等程序結束時纔會彈棧,所以全程可用。缺點就是啓動慢、編譯時間長;當然優點也有,如常說的,靜態類常用於窗體傳值和實現單例模式,這就得益於它的一次編譯全程可用。

(這就是爲什麼靜態類,靜態數據可以全程使用的原因了,因爲它們最先入棧,最後出棧)

        所以全局和靜態上面說過,會在程序運行結束時纔會被釋放和回收,所以應限制使用全局變量、常量、和靜態變量和靜態類,否則程序負荷高。


 

 

發佈了185 篇原創文章 · 獲贊 274 · 訪問量 110萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章