深入理解 Java 虛擬機:Java 內存區域透徹分析

前言

Java是目前用戶最多、使用範圍最廣的軟件開發技術,Java 的技術體系主要由支撐Java程序運行的虛擬機。爲各開發領域提供接口支持的Java API, Java編程語言及許許多多的第三方Java框架( 如Spring和Struts等)構成。在國內,有關Java API、Java 語言及第三方框架的技術資料和書籍非常豐富,相比之下,有關Java虛擬機的資料卻顯得異常貧乏。

這種狀況很大程度上是由Java開發技術本身的一個重要優點導致的:

在虛擬機層面隱藏了底層技術的複雜性以及機器與操作系統的差異性。運行程序的物理機器情況千差萬別,而Java虛擬機則在千差萬別的物理機上面建立了統一的運行平臺,實現了在任意一臺虛擬機上編譯的程序都能在任何一臺虛擬機上正常運行。這一極大的優勢使得Java應用的開發比傳統C/C++應用的開發更高效和快捷,程序員可以把主要精力集中在具體業務邏輯上,而不是物理硬件的兼容性上。

一般情況下,一個程序員只要瞭解了必要的Java API, Java語法井學習適當的第三方開發框架,就已經基本能滿足日常開發的需要了,虛擬機會在用戶不知不覺中完成對硬件平臺的兼容以及對內存等資源的管理工作。因此,瞭解虛擬機的運作並不是一般開發人員必須掌握的知識。然而,凡事都具備兩面性。隨着Java技術的不斷髮展,它被應用於越來越多的領域之中。其中一些領域,如電力、金融、通信等,對程序的性能、穩定性和可擴展性方面都有極高的要求。

一個程序很可能在10個人同時使用時完全正常,但是在10000個人同時使用時就會變慢、死鎖甚至崩潰。毫無疑問,要滿足10000個人同時使用需要更高性能的物理硬件,但是在絕大多數情況下,提升硬件效能無法等比例地提升程序的性能和併發能力,有時甚至可能對程序的性能沒有任何改善作用。

這裏面有Java虛擬機的原因:爲了達到爲所有硬件提供一致的虛擬平臺的目的,犧牲了一些硬件相關的性能特性。

更重要的是人爲原因:開發人員如果不瞭解虛擬機的一些技術特性的運行原理,就無法寫出最適合虛擬機運行和可自優化的代碼。

其實,目前商用的高性能Java虛擬機都提供了相當多的優化特性和調節手段,用於滿足應用程序在實際生產環境中對性能和穩定性的要求。如果只是爲了入門學習,讓程序在自己的機器上正常運行,那麼這些特性可以說是可有可無的;如果用於生產環境,尤其是企業級應用開發中,就迫切需要開發人員中至少有一部分人對虛擬機的特性及調節方法具有很清晰的認識,所以在Java開發體系中,對架構師、系統調優師、高級程序員等角色的需求一直都非常大。

關於JVM

JVM是Java Virtual Machine(Java虛擬機)的縮寫,JVM是一種用於計算設備的規範,它是一個虛構出來的計算機,是通過在實際的計算機上仿真模擬各種計算機功能來實現的。

引入Java語言虛擬機後,Java語言在不同平臺上運行時不需要重新編譯。Java語言使用Java虛擬機屏蔽了與具體平臺相關的信息,使得Java語言編譯程序只需生成在Java虛擬機上運行的目標代碼(字節碼),就可以在多種平臺上不加修改地運行。

Java內存區域透徹分析

這篇文章主要介紹Java內存區域,也是作爲Java虛擬機的一些最基本的知識,理解了這些知識之後,才能更好的進行Jvm調優或者更加深入的學習,本來這些知識是晦澀難懂的,所以希望能夠講解的透徹且形象。

運行時數據區域

JVM載執行Java程序的過程中會把它所管理的內存劃分爲若干個不同的數據區域。

Java 虛擬機所管理的內存一共分爲Method Area(方法區)、VM Stack(虛擬機棧)、Native Method Stack(本地方法棧)、Heap(堆)、Program Counter Register(程序計數器)五個區域。

這些區域都有各自的用途,以及創建和銷燬的時間,有的區域隨着虛擬機進程的啓動而存在,有些區域則是依賴用戶線程的啓動和結束而建立和銷燬。具體如下圖所示:

深入理解 Java 虛擬機:Java 內存區域透徹分析


上圖介紹的是JDK1.8 JVM運行時內存數據區域劃分。1.8同1.7比,最大的差別就是:元數據區取代了永久代。元空間的本質和永久代類似,都是對JVM規範中方法區的實現。不過元空間與永久代之間最大的區別在於:元數據空間並不在虛擬機中,而是使用本地內存

程序計數器(Program Counter Register)

程序計數器(Program Counter Register)是一塊較小的內存空間,可以看作是當前線程所執行的字節碼的行號指示器。在虛擬機概念模型中,字節碼解釋器工作時就是通過改變計數器的值來選取下一條需要執行的字節碼指令,分支、循環、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。

程序計數器是一塊 “線程私有” 的內存,每條線程都有一個獨立的程序計數器,能夠將切換後的線程恢復到正確的執行位置。

  • 執行的是一個Java方法

計數器記錄的是正在執行的虛擬機字節碼指令的地址

  • 執行的是Native方法

計數器爲空(Undefined),因爲native方法是java通過JNI直接調用本地C/C++庫,可以近似的認爲native方法相當於C/C++暴露給java的一個接口,java通過調用這個接口從而調用到C/C++方法。由於該方法是通過C/C++而不是java進行實現。那麼自然無法產生相應的字節碼,並且C/C++執行時的內存分配是由自己語言決定的,而不是由JVM決定的。

  • 程序計數器也是唯一一個在Java虛擬機規範中沒有規定任何OutOfMemoryError情況的內存區域。

其實,我感覺這塊區域,作爲我們開發人員來說是不能過多的干預的,我們只需要瞭解有這個區域的存在就可以,並且也沒有虛擬機相應的參數可以進行設置及控制。

Java虛擬機棧(Java Virtual Machine Stacks)

深入理解 Java 虛擬機:Java 內存區域透徹分析


Java虛擬機棧(Java Virtual Machine Stacks)描述的是Java方法執行的內存模型:每個方法在執行的同時都會創建一個棧幀(Stack Frame),從上圖中可以看出,棧幀中存儲着局部變量表操作數棧動態鏈接方法出口等信息。每一個方法從調用直至執行完成的過程,會對應一個棧幀在虛擬機棧中入棧到出棧的過程。

與程序計數器一樣,Java虛擬機棧也是線程私有的。

局部變量表中存放了編譯期可知的各種:

  • 基本數據類型(boolen、byte、char、short、int、 float、 long、double)

  • 對象引用(reference類型,它不等於對象本身,可能是一個指向對象起始地址的指針,也可能是指向一個代表對象的句柄或其他與此對象相關的位置)

  • returnAddress類型(指向了一條字節碼指令的地址)

其中64位長度的long和double類型的數據會佔用2個局部變量空間(Slot),其餘數據類型只佔用1個。局部變量表所需的內存空間在編譯期間完成分配,當進入一個方法時,這個方法需要在幀中分配多大的局部變量空間是完全確定的,在方法運行期間不會改變局部變量表的大小。

Java虛擬機規範中對這個區域規定了兩種異常狀況:

  • StackOverflowError:線程請求的棧深度大於虛擬機所允許的深度,將會拋出此異常。

  • OutOfMemoryError:當可動態擴展的虛擬機棧在擴展時無法申請到足夠的內存,就會拋出該異常。

一直覺得上面的概念性的知識還是比較抽象的,下面我們通過JVM參數的方式來控制棧的內存容量,模擬StackOverflowError異常現象。

本地方法棧(Native Method Stack)

本地方法棧(Native Method Stack) 與Java虛擬機棧作用很相似,它們的區別在於虛擬機棧爲虛擬機執行Java方法(即字節碼)服務,而本地方法棧則爲虛擬機使用到的Native方法服務。

在虛擬機規範中對本地方法棧中使用的語言、方式和數據結構並無強制規定,因此具體的虛擬機可實現它。甚至有的虛擬機(Sun HotSpot虛擬機)直接把本地方法棧和虛擬機棧合二爲一。與虛擬機一樣,本地方法棧會拋出StackOverflowErrorOutOfMemoryError異常。

  • 使用-Xss參數減少棧內存容量(更多的JVM參數可以參考這篇文章:深入理解Java虛擬機-常用vm參數分析)

這個例子中,我們將棧內存的容量設置爲256K(默認1M),並且再定義一個變量查看棧遞歸的深度。

 /**
 * @ClassName Test_02
 * @Description 設置Jvm參數:-Xss256k
 * @Author 歐陽思海
 * @Date 2019/9/30 11:05
 * @Version 1.0
 **/
 public class Test_02 {
 
 private int len = 1;

 public void stackTest() {
 len++;
 System.out.println("stack len:" + len);
 stackTest();
 }

 public static void main(String[] args) {
 Test_02 test = new Test_02();
 try {
 test.stackTest();
2 } catch (Throwable e) {
23 e.printStackTrace();
24 }
25 }
26}

運行時設置JVM參數

深入理解 Java 虛擬機:Java 內存區域透徹分析


輸出結果:

深入理解 Java 虛擬機:Java 內存區域透徹分析


 Java堆(Heap)

對於大多數應用而言,Java堆(Heap)是Java虛擬機所管理的內存中最大的一塊,它被所有線程共享的,在虛擬機啓動時創建。此內存區域唯一的目的存放對象實例,幾乎所有的對象實例都在這裏分配內存,且每次分配的空間是不定長的。在Heap 中分配一定的內存來保存對象實例,實際上只是保存對象實例的屬性值屬性的類型對象本身的類型標記等,並不保存對象的方法(方法是指令,保存在Stack中),在Heap 中分配一定的內存保存對象實例和對象的序列化比較類似。

Java堆是垃圾收集器管理的主要區域,因此也被稱爲 “GC堆(Garbage Collected Heap)” 。從內存回收的角度看內存空間可如下劃分:

深入理解 Java 虛擬機:Java 內存區域透徹分析


圖片摘自https://blog.csdn.net/bruce128/article/details/79357870

  • 新生代(Young):新生成的對象優先存放在新生代中,新生代對象朝生夕死,存活率很低。在新生代中,常規應用進行一次垃圾收集一般可以回收70% ~ 95% 的空間,回收效率很高。

如果把新生代再分的細緻一點,新生代又可細分爲Eden空間From Survivor空間To Survivor空間,默認比例爲8:1:1。

  • 老年代(Tenured/Old):在新生代中經歷了多次(具體看虛擬機配置的閥值)GC後仍然存活下來的對象會進入老年代中。老年代中的對象生命週期較長,存活率比較高,在老年代中進行GC的頻率相對而言較低,而且回收的速度也比較慢。

  • 永久代(Perm):永久代存儲類信息、常量、靜態變量、即時編譯器編譯後的代碼等數據,對這一區域而言,Java虛擬機規範指出可以不進行垃圾收集,一般而言不會進行垃圾回收。

其中新生代和老年代組成了Java堆的全部內存區域,而永久代不屬於堆空間,它在JDK 1.8以前被Sun HotSpot虛擬機用作方法區的實現

另外,再強調一下堆空間內存分配的大體情況,這對於後面一些Jvm優化的技巧還是有幫助的。

  • 老年代 :三分之二的堆空間

  • 年輕代 :三分之一的堆空間
    eden區:8/10 的年輕代空間
    survivor0 : 1/10 的年輕代空間
    survivor1 : 1/10 的年輕代空間

最後,我們再通過一個簡單的例子更加形象化的展示一下堆溢出的情況。

  • JVM參數設置:-Xms10m -Xmx10m

這裏將堆的最小值和最大值都設置爲10m,如果不瞭解這些參數的含義,可以參考這篇文章:深入理解Java虛擬機-常用vm參數分析

 /**
 * VM Args:-Xms10m -Xmx10m -XX:+HeapDumpOnOutOfMemoryError
 * @author zzm
 */
 public class HeapTest {
 
 static class HeapObject {
 }
 
 public static void main(String[] args) {
 List<HeapObject> list = new ArrayList<HeapObject>();

 //不斷的向堆中添加對象
 while (true) {
 list.add(new HeapObject());
 }
 }
}

輸出結果:

深入理解 Java 虛擬機:Java 內存區域透徹分析


圖中出現了java.lang.OutOfMemoryError,並且提示了Java heap space,這就說明是Java堆內存溢出的情況。

堆的Dump文件分析

我的使用的是VisualVM工具進行分析,關於如何使用這個工具查看這篇文章(深入理解Java虛擬機-如何利用VisualVM對高併發項目進行性能分析 )。在運行程序之後,會同時打開VisualVM工具,查看堆內存的變化情況。

深入理解 Java 虛擬機:Java 內存區域透徹分析


在上圖中,可以看到,堆的最大值是30m,但是使用的堆的容量也快接近30m了,所以很容易發生堆內存溢出的情況。

接着查看dump文件。

深入理解 Java 虛擬機:Java 內存區域透徹分析


如上圖,堆中的大部分的對象都是HeapObject,所以,就是因爲這個對象的一直產生,所以導致堆內存不夠分配,所以出現內存溢出。

我們再看GC情況。

深入理解 Java 虛擬機:Java 內存區域透徹分析


如上圖,Eden新生代總共48次minor gc,耗時1.168s,基本滿足要求,但是survivor卻沒有,這不正常,同時Old Gen老年代總共27次full gc,耗時4.266s,耗時長,gc多,這正是因爲大量的大對象進入到老年代導致的,所以,導致full gc頻繁。

方法區(Method Area)

方法區(Method Area) 與Java堆一樣,是各個線程共享的內存區域。它用於存儲一杯虛擬機加載的類信息、常量、靜態變量、及時編譯器編譯後的代碼等數據。正因爲方法區所存儲的數據與堆有一種類比關係,所以它還被稱爲 Non-Heap

運行時常量池(Runtime Constant Pool)

運行時常量池(Runtime Constant Pool)是方法區的一部分。Class文件中除了有類的版本、字段、方法、接口等描述信息外,還有一項信息是常量池(Constant Pool Table),用於存放編譯期生成的各種字面量和符號引用,這部分內容將在類加載後進入方法區的運行時常量池存放

Java虛擬機對Class文件每一部分(自然包括常量池)的格式有嚴格規定,每一個字節用於存儲那種數據都必須符合規範上的要求才會被虛擬機認可、裝載和執行。但對於運行時常量池,Java虛擬機規範沒有做任何有關細節的要求,不同的提供商實現的虛擬機可以按照自己的需求來實現此內存區域。不過一般而言,除了保存Class文件中的描述符號引用外,還會把翻譯出的直接引用也存儲在運行時常量池中。

運行時常量池相對於Class文件常量池的另外一個重要特徵是具備動態性,Java語言並不要求常量一定只有編譯器才能產生,也就是並非置入Class文件中的常量池的內容才能進入方法區運行時常量池,運行期間也可能將新的常量放入池中

運行時常量池舉例

上面的動態性在開發中用的比較多的便是String類的intern() 方法。所以,我們以intern() 方法舉例,講解一下運行時常量池

String.intern()是一個native方法,作用是:如果字符串常量池中已經包含有一個等於此String對象的字符串,則直接返回池中的字符串;否則,加入到池中,並返回。

 /**
 * @ClassName MethodTest
 * @Description vm參數設置:-Xms512m -Xmx512m -Xmn128m -XX:PermSize=10M -XX:MaxPermSize=10M -XX:NewRatio=4 -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=15 -XX:-HeapDumpOnOutOfMemoryError -XX:+UseParNewGC -XX:+UseConcMarkSweepGC
 * @Author 歐陽思海
 * @Date 2019/11/25 20:06
 * @Version 1.0
 **/
 
 public class MethodTest {

 public static void main(String[] args) {
 List<String> list = new ArrayList<String>();
 long i = 0;
 while (i < 1000000000) {
 System.out.println(i);
 list.add(String.valueOf(i++).intern());
 }
 }
}

vm參數介紹:

-Xms512m -Xmx512m -Xmn128m -XX:PermSize=10M -XX:MaxPermSize=10M -XX:NewRatio=4 -XX:SurvivorRatio=8 -XX:MaxTenuringThreshold=15 -XX:-HeapDumpOnOutOfMemoryError -XX:+UseParNewGC -XX:+UseConcMarkSweepGC
開始堆內存和最大堆內存都是512m,永久代大小10m,新生代和老年代1:4,E:S1:S2=8:1:1,最大經過15次survivor進入老年代,使用的,垃圾收集器是新生代ParNew,老年代CMS。

通過這樣的設置之後,查看運行結果:

深入理解 Java 虛擬機:Java 內存區域透徹分析


首先堆內存耗完,然後看看GC情況,設置這些參數之後,GC情況應該會不錯,拭目以待。

深入理解 Java 虛擬機:Java 內存區域透徹分析


上圖是GC情況,我們可以看到新生代 21 次minor gc,用了1.179秒,平均不到50ms一次,性能不錯,老年代 117 次full gc,用了45.308s,平均一次不到1s,性能也不錯,說明jvm運行是不錯的。

注意: 在JDK1.6及以前的版本中運行以上代碼,因爲我們通過-XX:PermSize=10M -XX:MaxPermSize=10M設置了方法區的大小,所以也就是設置了常量池的容量,所以運行之後,會報錯:java.lang.OutOfMemoryError:PermGen space,這說明常量池溢出;在JDK1.7及以後的版本中,將會一直運行下去,不會報錯,在前面也說到,JDK1.7及以後,去掉了永久代。

直接內存

直接內存(Direct Memory)並不是虛擬機運行時數據區的一部分,也不是Java虛擬機規範中定義的內存區域。但這部分內存也被頻繁運用,而卻可能導致OutOfMemoryError異常出現。

這個我們實際中主要接觸到的就是NIO,在NIO中,我們爲了能夠加快IO操作,採用了一種直接內存的方式,使得相比於傳統的IO快了很多。

在NIO引入了一種基於通道(Channel)與緩衝區(Buffer)的I/O方式,它可以使用Native函數庫直接分配堆外內存,然後通過一個存儲在Java堆中的DirectByteBuffer對象作爲這塊內存的引用進行操作。這樣能避免在Java堆和Native堆中來回複製數據,在一些場景裏顯著提高性能。

在配置虛擬機參數時,會根據實際內存設置-Xmx等參數信息,但經常忽略直接內存,使得各個內存區域總和大於物理內存限制(包括物理的和操作系統的限制),從而導致動態擴展時出現OutOfMemoryError異常。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章