深度學習JVM之一 虛擬機運行時數據區

爲什麼需要JVM

Java 能成爲操作系統平臺無關性語言和核心就在於JAVA虛擬機,Java虛擬機是Java語言的基石,Java虛擬機可以看作一臺抽象的計算機,如同真實的計算機一樣,Java虛擬機有自己的指令集和運行時內存區域。

用Java語言編寫的代碼只有經過編譯器編譯爲二進制字節碼的class文件纔可以運行在Java虛擬機上,class文件包含了Java虛擬機的指令集(二進制字節碼bytecode)和符號表,以及一些其他的輔助信息。

Java虛擬機運行時數據區

根據 《Java 虛擬機規範》 規定,Java 虛擬機所管理的內存如下圖所示。
Java虛擬機運行時數據區

方法區(Method Area)

  • 線程共享內存區域,用於儲存已被虛擬機加載的類信息、常量、靜態變量,即時編譯器編譯後的代碼,雖然Java虛擬機規範把方法區描述爲堆的一個邏輯部分,但是它卻有一個別名叫做Non-Heap(非堆),目的應該是與Java堆區分開來。

  • 對於習慣在HotSpot虛擬機上開發和部署程序的開發者來說,很多人願意把方法區稱爲“永久代”(Permanent Generation),本質上兩者並不等價,僅僅是因爲HotSpot虛擬機的設計團隊選擇把GC分代收集擴展至方法區,或者說使用永久代來實現方法區而已。

  • Java虛擬機規範對這個區域的限制非常寬鬆,除了和Java堆一樣不需要連續的內存和可以選擇固定大小或者可擴展外,還可以選擇不實現垃圾收集。相對而言,垃圾收集行爲在這個區域是比較少出現的,但並非數據進入了方法區就如永久代的名字一樣“永久”存在了。這個區域的內存回收目標主要是針對常量池的回收和對類型的卸載,一般來說這個區域的回收“成績”比較難以令人滿意,尤其是類型的卸載,條件相當苛刻,但是這部分區域的回收確實是有必要的。

  • 根據Java虛擬機規範的規定,當方法區無法滿足內存分配需求時,將拋出OutOfMemoryError異常。

  • Java8以後修改爲元數據區。

虛擬機棧(VM Stacks)

  • Java虛擬機棧(Java Virtual Machine Stacks)是線程私有的,它的生命週期與線程相同。虛擬機棧描述的是Java方法執行的內存模型:每個方法被執行的時候都會同時創建一個棧幀(Stack Frame)用於存儲局部變量表、操作棧、動態鏈接、方法出口等信息。每一個方法被調用直至執行完成的過程,就對應着一個棧幀在虛擬機棧中從入棧到出棧的過程。

    • 局部變量表:局部變量表存放了編譯期可知的各種基本數據類型(boolean、byte、char、short、int、float、long、double)、對象引用(reference類型,它不等同於對象本身,根據不同的虛擬機實現,它可能是一個指向對象起始地址的引用指針,也可能指向一個代表對象的句柄或者其他與此對象相關的位置)和returnAddress類型(指向了一條字節碼指令的地址)。其中64位長度的long和double類型的數據會佔用2個局部變量空間(Slot),其餘的數據類型只佔用1個。局部變量表所需的內存空間在編譯期間完成分配,當進入一個方法時,這個方法需要在幀中分配多大的局部變量空間是完全確定的,在方法運行期間不會改變局部變量表的大小。
    • 操作數棧:基於棧的執行引擎,虛擬機把操作數棧作爲它的工作區,大多數指令都要從這裏彈出數據、執行運算,然後把結果壓回操作數棧。
    • 動態連接:每個棧幀都包含一個指向運行時常量池(方法區的一部分)中該棧幀所屬方法的引用。持有這個引用是爲了支持方法調用過程中的動態連接。Class文件的常量池中有大量的符號引用,字節碼中的方法調用指令就以常量池中指向方法的符號引用爲參數。這些符號引用一部分會在類加載階段或第一次使用的時候轉化爲直接引用,這種轉化稱爲靜態解析。另一部分將在每一次的運行期間轉化爲直接應用,這部分稱爲動態連接
    • 方法出口:返回方法被調用的位置,恢復上層方法的局部變量和操作數棧,如果無返回值,則把它壓入調用者的操作數棧。
  • 在Java虛擬機規範中,對這個區域規定了兩種異常狀況:如果線程請求的棧深度大於虛擬機所允許的深度,將拋出StackOverflowError異常;如果虛擬機棧可以動態擴展(當前大部分的Java虛擬機都可動態擴展,只不過Java虛擬機規範中也允許固定長度的虛擬機棧),當擴展時無法申請到足夠的內存時會拋出OutOfMemoryError異常。

本地方法棧(Native Method Stacks)

  • 與虛擬機棧一樣,本地方法棧(Native Method Stacks)也是線程私有的。本地方法棧與虛擬機棧所發揮的作用是非常相似的,其區別不過是虛擬機棧爲虛擬機執行Java方法(也就是字節碼)服務,而本地方法棧則是爲虛擬機使用到的Native方法服務。虛擬機規範中對本地方法棧中的方法使用的語言、使用方式與數據結構並沒有強制規定,因此具體的虛擬機可以自由實現它。甚至有的虛擬機(譬如Sun HotSpot虛擬機)直接就把本地方法棧和虛擬機棧合二爲一。

  • 與虛擬機棧一樣,本地方法棧區域也會拋出StackOverflowError和OutOfMemoryError異常。

程序計數器(Program Counter Register)

  • 程序計數器(Program Counter Register)是一塊較小的內存空間,它的作用可以看做是當前線程所執行的字節碼的行號指示器。在虛擬機的概念模型裏(僅是概念模型,各種虛擬機可能會通過一些更高效的方式去實現),字節碼解釋器工作時就是通過改變這個計數器的值來選取下一條需要執行的字節碼指令,分支、循環、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。

  • 由於Java虛擬機的多線程是通過線程輪流切換並分配處理器執行時間的方式來實現的,在任何一個確定的時刻,一個處理器(對於多核處理器來說是一個內核)只會執行一條線程中的指令。因此,爲了線程切換後能恢復到正確的執行位置,每條線程都需要有一個獨立的程序計數器,各條線程之間的計數器互不影響,獨立存儲,我們稱這類內存區域爲“線程私有”的內存。

  • 如果線程正在執行的是一個Java方法,這個計數器記錄的是正在執行的虛擬機字節碼指令的地址;如果正在執行的是Natvie方法,這個計數器值則爲空(Undefined)。

  • 此內存區域是唯一一個在Java虛擬機規範中沒有規定任何OutOfMemoryError情況的區域。

  • 對於大多數應用來說,Java堆(Java Heap)是Java虛擬機所管理的內存中最大的一塊。Java堆是被所有線程共享的一塊內存區域,在虛擬機啓動時創建。此內存區域的唯一目的就是存放對象實例,幾乎所有的對象實例都在這裏分配內存。

  • Java堆是垃圾收集器管理的主要區域,因此很多時候也被稱做“GC堆”。如果從內存回收的角度看,由於現在收集器基本都是採用的分代收集算法,所以Java堆中還可以細分爲:新生代和老年代;再細緻一點的有Eden空間、From Survivor空間、To Survivor空間等。

  • 根據Java虛擬機規範的規定,Java堆可以處於物理上不連續的內存空間中,只要邏輯上是連續的即可,就像我們的磁盤空間一樣。在實現時,既可以實現成固定大小的,也可以是可擴展的,不過當前主流的虛擬機都是按照可擴展來實現的(通過-Xmx和-Xms控制)。

  • 如果在堆中沒有內存完成實例分配,並且堆也無法再擴展時,將會拋出OutOfMemoryError異常。

運行時常量池

  • 運行時常量池(Runtime Constant Pool):方法區的一部分,所有線程共享。虛擬機加載Class後把常量池中的數據放入到運行時常量池。常量池:可以理解爲Class文件之中的資源倉庫,它是Class文件結構中與其他項目資源關聯最多的數據類型,存儲了類、方法、接口等中的常量,當然也包括字符串常量。

  • 常量池中主要存放兩大類常量:字面量(Literal)和符號引用(Symbolic Reference)。

    • 字面量:文本字符串、聲明爲final的常量值等;。
    • 符號引用:類和接口的完全限定名(Fully Qualified Name)、字段的名稱和描述符(Descriptor)、方法的名稱和描述符。
  • JDK1.6之前字符串常量池位於方法區之中。

  • JDK1.7字符串常量池已經被挪到堆之中。

直接內存

  • 直接內存(Direct Memory)並不是虛擬機運行時數據區的一部分,也不是Java虛擬機規範中定義的內存區域,但是這部分內存也被頻繁地使用,而且也可能導致OutOfMemoryError異常出現。
  • 在 JDK 1.4 中新加入 NIO (New Input/Output) 類,引入了一種基於通道(Channel)和緩存(Buffer)的 I/O 方式,它可以使用 Native 函數庫直接分配堆外內存,然後通過一個存儲在 Java 堆中的 DirectByteBuffer 對象作爲這塊內存的引用進行操作。可以避免在 Java 堆和 Native 堆中來回的數據耗時操作。

運行時數據區的內容存儲

總的來說運行時數據區的每個區域存儲的內容如下:
運行時數據區的內容存儲

JVM內存結構

JVM內存結構主要有三大塊:堆內存、方法區和棧。堆內存是JVM中最大的一塊由年輕代和老年代組成,而年輕代內存又被分成三部分,Eden空間、From Survivor空間、To Survivor空間,默認情況下年輕代按照8:1:1的比例來分配;

方法區存儲類信息、常量、靜態變量等數據,是線程共享的區域,爲與Java堆區分,方法區還有一個別名Non-Heap(非堆);棧又分爲java虛擬機棧和本地方法棧主要用於方法的執行。

在通過一張圖來了解如何通過參數來控制各區域的內存大小
JVM內存結構

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章