探究JVM——運行時數據區

最近在讀《深入理解Java虛擬機》,收穫頗豐,記錄一下,部分內容摘自原書。

 

Java虛擬機在執行Java程序的過程中會把它所管理的內存劃分爲若干個不同的數據區域。這些區域都有各自的用途,以及創建和銷燬的時間,有的區域隨着虛擬機進程的啓動而存在,有些區域則依賴用戶線程的啓動和結束而建立和銷燬。Java虛擬機所管理的內存將會包括以下幾個運行時數據區域,如圖所示:

 

        

 

其中程序計數器VM棧native棧爲線程隔離的,堆(Heap)方法區(Method Aera,or Non-Heap)爲線程共享的。至於常量池,自JDK 1.7的HotSpot VM後,把原本放在方法區的字符串常量池移出。

           

下面來一個個介紹各個區域:

1.程序計數器(Program Counter Register)

  

  程序計數器是一塊較小的內存空間,它可以看作是當前線程所執行的字節碼的行號指示器。

 

  在虛擬機的概念模型裏(僅是概念模型,各種虛擬機可能會通過一些更高效的方式去實現),字節碼解釋器工作時就是通過改變這個計數器的值來選取下一條需要執行的字節碼指令,分支、循環、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。

 

  由於Java虛擬機的多線程是通過線程輪流切換並分配處理器執行時間的方式來實現的,在任何一個確定的時刻,一個處理器(對於多核處理器來說是一個內核)都只會執行一條線程中的指令。因此,爲了線程切換後能恢復到正確的執行位置,每條線程都需要有一個獨立的程序計數器,各條線程之間計數器互不影響,獨立存儲,我們稱這類內存區域爲“線程私有”的內存。

 

  如果線程正在執行的是一個Java方法,這個計數器記錄的是正在執行的虛擬機字節碼指令的地址;如果正在執行的是Native方法,這個計數器值則爲空(Undefined)。此內存區域是唯一一個在Java虛擬機規範中沒有規定任何OutOfMemoryError情況的區域。

 

2.Java虛擬機棧(Java Virtual Machine Stacks)

  

  與程序計數器一樣,Java虛擬機棧也是線程私有的,它的生命週期與線程相同。

 

  虛擬機棧描述的是Java方法執行的內存模型:每個方法在執行的同時都會創建一個棧幀(Stack Frame)用於存儲局部變量表、操作數棧、動態鏈接、方法出口等信息。每一個方法從調用直至執行完成的過程,就對應着一個棧幀在虛擬機棧中入棧到出棧的過程。

 

  通常會認爲內存區分爲堆內存(Heap)棧內存(Stack),所指的“棧”就是現在講的虛擬機棧,或者說是虛擬機棧中局部變量表部分。

 

  局部變量表存放了編譯期可知的各種基本數據類型(boolean、byte、char、short、int、float、long、double)對象引用(reference類型,它不等同於對象本身,可能是一個指向對象起始地址的引用指針,也可能是指向一個代表對象的句柄或其他與此對象相關的位置)returnAddress類型(指向了一條字節碼指令的地址)

 

  其中64位長度的long和double類型的數據會佔用2個局部變量空間(Slot),其餘的數據類型只佔用1個。局部變量表所需的內存空間在編譯期間完成分配,當進入一個方法時,這個方法需要在幀中分配多大的局部變量空間是完全確定的,在方法運行期間不會改變局部變量表的大小。

 

  StackOverflow:如果線程請求的棧深度大於虛擬機所允許的深度,將拋出StackOverflowError異常

  OOM:如果虛擬機棧可以動態擴展(當前大部分的Java虛擬機都可動態擴展,只不過Java虛擬機規範中也允許固定長度的虛擬機棧),如果擴展時無法申請到足夠的內存,就會拋出OutOfMemoryError異常。

 

3.本地方法棧(Native Method Stack)

  

  與VM棧所作用非常相似,區別是VM棧爲虛擬機執行Java方法(也就是字節碼)服務,而本地方法棧則爲虛擬機使用到的Native方法服務。

 

  在虛擬機規範中對本地方法棧中方法使用的語言、使用方式與數據結構並沒有強制規定,因此具體的虛擬機可以自由實現它。甚至有的虛擬機(譬如Sun HotSpot虛擬機)直接就把本地方法棧和虛擬機棧合二爲一。與虛擬機棧一樣,本地方法棧區域也會拋出StackOverflowError和OutOfMemoryError異常。

 

  StackOverflow:同虛擬機棧

  OOM:同虛擬機棧

 

 

以上都是線程私有的內存區域,下面是線程共享內存區域:

 

1.Java堆(Heap)

  

  Java堆是被所有線程共享的一塊內存區域,在虛擬機啓動時創建。  

 

  此內存區域的唯一目的就是存放對象實例,幾乎所有的對象實例都在這裏分配內存。對於大多數應用來說,Java堆(Java Heap)是Java虛擬機所管理的內存中最大的一塊。這一點在Java虛擬機規範中的描述是:所有的對象實例以及數組都要在堆上分配,但是隨着JIT編譯器的發展與逃逸分析技術逐漸成熟,棧上分配、標量替換優化技術將會導致一些微妙的變化發生,所有的對象都分配在堆上也漸漸變得不是那麼“絕對”了。

 

  Java堆是垃圾收集器管理的主要區域,因此很多時候也被稱做“GC堆”(Garbage Collected Heap)。

 

  從內存回收的角度來看,由於現在收集器基本都採用分代收集算法,所以Java堆中還可以細分爲:新生代老年代;再細緻一點的話新生代中分爲Eden空間From Survivor空間、To Survivor空間等。

 

  從內存分配的角度來看,線程共享的Java堆中可能劃分出多個線程私有的分配緩衝區(Thread Local Allocation Buffer,TLAB)。不過無論如何劃分,都與存放內容無關,無論哪個區域,存儲的都仍然是對象實例,進一步劃分的目的是爲了更好地回收內存,或者更快地分配內存。

 

  Java堆可以處於物理上不連續的內存空間中,只要邏輯上是連續的即可,就像我們的磁盤空間一樣。在實現時,既可以實現成固定大小的,也可以是可擴展的,不過當前主流的虛擬機都是按照可擴展來實現的(通過-Xmx和-Xms控制)。

 

  OOM:如果在堆中沒有內存完成實例分配,並且堆也無法再擴展時,將會拋出OutOfMemoryError異常。

 

2.方法區(Method Area)

  

  用於存儲已被虛擬機加載的類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據。

  雖然Java虛擬機規範把方法區描述爲堆的一個邏輯部分,但是它卻有一個別名叫做Non-Heap(非堆),目的應該是與Java堆區分開來。

 

  永久代:對於習慣在HotSpot虛擬機上開發、部署程序的開發者來說,很多人都更願意把方法區稱爲“永久代”(Permanent Generation),本質上兩者並不等價,僅僅是因爲HotSpot虛擬機的設計團隊選擇把GC分代收集擴展至方法區,或者說使用永久代來實現方法區而已。這樣HotSpot的垃圾收集器可以像管理Java堆一樣管理這部分內存,能夠省去專門爲方法區編寫內存管理代碼的工作。對於其他虛擬機(如BEA JRockit、IBM J9等)來說是不存在永久代的概念的。

 

  根據官方發佈的路線圖信息,現在也有放棄永久代並逐步改爲採用Native Memory來實現方法區的規劃了,在目前已經發布的JDK 1.7的HotSpot中,已經把原本放在永久代的字符串常量池移出。

 

  方法區和Java堆一樣不需要連續的內存和可以選擇固定大小或者可擴展外,還可以選擇不實現垃圾收集。相對而言,垃圾收集行爲在這個區域是比較少出現的,但並非數據進入了方法區就如永久代的名字一樣“永久”存在了。這區域的內存回收目標主要是針對常量池的回收和對類型的卸載,一般來說,這個區域的回收“成績”比較難以令人滿意,尤其是類型的卸載,條件相當苛刻,但是這部分區域的回收確實是必要的。

 

  OOM:根據Java虛擬機規範的規定,當方法區無法滿足內存分配需求時,將拋出OutOfMemoryError異常。

 

3.運行時常量池(Runtime Constant Pool)

  

  運行時常量池是方法區的一部分Class文件中除了有類的版本、字段、方法、接口等描述信息外,還有一項信息是常量池(Constant Pool Table),用於存放編譯期生成的各種字面量和符號引用,這部分內容將在類加載後進入方法區的運行時常量池中存放。

 

  Java虛擬機對Class文件每一部分(自然也包括常量池)的格式都有嚴格規定,每一個字節用於存儲哪種數據都必須符合規範上的要求才會被虛擬機認可、裝載和執行,但對於運行時常量池,不同的提供商實現的虛擬機可以按照自己的需要來實現這個內存區域。不過,一般來說,除了保存Class文件中描述的符號引用外,還會把翻譯出來的直接引用也存儲在運行時常量池中。

 

  運行時常量池相對於Class文件常量池的另外一個重要特徵是具備動態性,Java語言並不要求常量一定只有編譯期才能產生,也就是並非預置入Class文件中常量池的內容才能進入方法區運行時常量池,運行期間也可能將新的常量放入池中,這種特性利用得比較多的是String類的intern()方法。

 

  OOM:既然運行時常量池是方法區的一部分,自然受到方法區內存的限制,當常量池無法再申請到內存時會拋出OutOfMemoryError異常。

 

 

除此之外,還有一部分內存區域:

直接內存(Direct Memory)

  

  直接內存並不是虛擬機運行時數據區的一部分,也不是Java虛擬機規範中定義的內存區域,字面上的意思,是本機的直接內存。這部分內存也被頻繁地使用。

 

  在JDK 1.4中新加入了NIO(New Input/Output)類,引入了一種基於通道(Channel)與緩衝區(Buffer)的I/O方式,它可以使用Native函數庫直接分配堆外內存,然後通過一個存儲在Java堆中的DirectByteBuffer對象作爲這塊內存的引用進行操作。這樣能在一些場景中顯著提高性能,因爲避免了在Java堆和Native堆中來回複製數據。

 

  本機直接內存的分配不會受到Java堆大小的限制,但還是會受到本機總內存(包括RAM以及SWAP區或者分頁文件)大小以及處理器尋址空間的限制。

 

  OOM:配置虛擬機參數時,根據實際內存設置-Xmx等參數信息時,經常忽略直接內存,使得各個內存區域總和大於物理內存限制(包括物理的和操作系統級的限制),從而導致動態擴展時出現OutOfMemoryError異常。

 

以上

發佈了82 篇原創文章 · 獲贊 101 · 訪問量 15萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章