JVM內存區域與分配

先來看看JVM運行時候的內存區域

大多數 JVM 將內存區域劃分爲 

  • Method Area(Non-Heap)(方法區),
  • Heap(堆),
  • Program Counter Register(程序計數器),
  • VM Stack(虛擬機棧,也有翻譯成JAVA 方法棧的),
  • Native Method Stack本地方法棧),

其中Method AreaHeap是線程共享的,VMStack,Native Method Stack 和Program Counter Register是非線程共享的。爲什麼分爲線程共享和非線程共享的呢?請繼續往下看。

 一般性的 Java 程序的工作過程:一個 Java 源程序文件,會被編譯爲字節碼文件(以 class 爲擴展名),每個java程序都需要運行在自己的JVM上,然後告知 JVM 程序的運行入口,再被 JVM 通過字節碼解釋器加載運行。

JVM初始運行的時候都會分配好Method Area(方法區)Heap(堆),而JVM 每遇到一個線程,就爲其分配一個Program Counter Register(程序計數器), VM Stack(虛擬機棧)和Native Method Stack (本地方法棧),當線程終止時,三者(虛擬機棧,本地方法棧和程序計數器)所佔用的內存空間也會被釋放掉。這也是爲什麼我把內存區域分爲線程共享和非線程共享的原因,非線程共享的那三個區域的生命週期與所屬線程相同,而線程共享的區域與JAVA程序運行的生命週期相同,所以這也是系統垃圾回收的場所只發生在線程共享的區域(實際上對大部分虛擬機來說只發生在Heap上)的原因。

1. 程序計數器

  程序計數器是一塊較小的內存區域,作用可以看做是當前線程執行的字節碼的位置指示器。分支、循環、跳轉、異常處理和線程恢復等基礎功能都需要依賴這個計算器來完成。

2. VM Strack

  先來了解下JAVA指令的構成:

  JAVA指令由 操作碼 (方法本身)和 操作數 (方法內部變量) 組成。   

    1)方法本身是指令的操作碼部分,保存在Stack中;

    2)方法內部變量(局部變量)作爲指令的操作數部分,跟在指令的操作碼之後,保存在Stack中(實際上是簡單類型(int,byte,short 等)保存在Stack中,對象類型在Stack中保存地址,在Heap 中保存值);

  虛擬機棧也叫棧內存,是在線程創建時創建,它的生命期是跟隨線程的生命期,線程結束棧內存也就釋放,對於棧來說不存在垃圾回收問題,只要線程一結束,該棧就 Over,所以不存在垃圾回收。也有一些資料翻譯成JAVA方法棧,大概是因爲它所描述的是java方法執行的內存模型,每個方法執行的同時創建幀棧(Stack Frame)用於存儲局部變量表(包含了對應的方法參數和局部變量),操作棧(Operand Stack,記錄出棧、入棧的操作),動態鏈接、方法出口等信息,每個方法被調用直到執行完畢的過程,對應這幀棧在虛擬機棧的入棧和出棧的過程。

  局部變量表存放了編譯期可知的各種基本數據類型(boolean、byte、char、short、int、float、long、double)、對象的引用(reference類型,不等同於對象本身,根據不同的虛擬機實現,可能是一個指向對象起始地址的引用指針,也可能是一個代表對象的句柄或者其他與對象相關的位置)和 returnAdress類型(指向下一條字節碼指令的地址)。局部變量表所需的內存空間在編譯期間完成分配,在方法在運行之前,該局部變量表所需要的內存空間是固定的,運行期間也不會改變。

  棧幀是一個內存區塊,是一個數據集,是一個有關方法(Method)和運行期數據的數據集,當一個方法 A 被調用時就產生了一個棧幀 F1,並被壓入到棧中,A 方法又調用了 B 方法,於是產生棧幀 F2 也被壓入棧,執行完畢後,先彈出 F2棧幀,再彈出 F1 棧幀,遵循“先進後出”原則。光說比較枯燥,我們看一個圖來理解一下 Java棧,如下圖所示:

3.Heap

  Heap(堆)是JVM的內存數據區。Heap 的管理很複雜,是被所有線程共享的內存區域,在JVM啓動時候創建,專門用來保存對象的實例。在Heap 中分配一定的內存來保存對象實例,實際上也只是保存對象實例的屬性值,屬性的類型和對象本身的類型標記等,並不保存對象的方法(以幀棧的形式保存在Stack中),在Heap 中分配一定的內存保存對象實例。而對象實例在Heap 中分配好以後,需要在Stack中保存一個4字節的Heap 內存地址,用來定位該對象實例在Heap 中的位置,便於找到該對象實例,是垃圾回收的主要場所。java堆處於物理不連續的內存空間中,只要邏輯上連續即可。

4.Method Area

  Object Class Data(加載類的類定義數據) 是存儲在方法區的。除此之外,常量靜態變量、JIT(即時編譯器)編譯後的代碼也都在方法區。正因爲方法區所存儲的數據與堆有一種類比關係,所以它還被稱爲 Non-Heap。方法區也可以是內存不連續的區域組成的,並且可設置爲固定大小,也可以設置爲可擴展的,這點與堆一樣。

  垃圾回收在這個區域會比較少出現,這個區域內存回收的目的主要針對常量池的回收和類的卸載。

5.運行時常量池(Runtime Constant Pool)

  方法區內部有一個非常重要的區域,叫做運行時常量池(Runtime Constant Pool,簡稱 RCP)。在字節碼文件(Class文件)中,除了有類的版本、字段、方法、接口等先關信息描述外,還有常量池(Constant Pool Table)信息,用於存儲編譯器產生的字面量和符號引用。這部分內容在類被加載後,都會存儲到方法區中的RCP。值得注意的是,運行時產生的新常量也可以被放入常量池中,比如 String 類中的 intern() 方法產生的常量。

  常量池就是這個類型用到的常量的一個有序集合。包括直接常量(基本類型,String)對其他類型、方法、字段的符號引用.例如:

◆類和接口的全限定名;

◆字段的名稱和描述符;

◆方法和名稱和描述符。

  池中的數據和數組一樣通過索引訪問。由於常量池包含了一個類型所有的對其他類型、方法、字段的符號引用,所以常量池在Java的動態鏈接中起了核心作用.

  很有用且重要關於常量池的擴展:Java常量池詳解 http://www.cnblogs.com/DreamSea/archive/2011/11/20/2256396.html

6.Native Method Stack

  與VM Strack相似,VM Strack爲JVM提供執行JAVA方法的服務,Native Method Stack則爲JVM提供使用native 方法的服務。

7.直接內存區

  直接內存區並不是 JVM 管理的內存區域的一部分,而是其之外的。該區域也會在 Java 開發中使用到,並且存在導致內存溢出的隱患。如果你對 NIO 有所瞭解,可能會知道 NIO 是可以使用 Native Methods 來使用直接內存區的。

小結:

  •   在此,你對JVM的內存區域有了一定的理解,JVM內存區域可以分爲線程共享和非線程共享兩部分,線程共享的有堆和方法區,非線程共享的有虛擬機棧,本地方法棧和程序計數器。

8.JVM運行原理 例子

     第 1 步 、向操作系統申請空閒內存。JVM 對操作系統說“給我 64M(隨便模擬數據,並不是真實數據) 空閒內存”,於是,JVM 向操作系統申請空閒內存作系統就查找自己的內存分配表,找了段 64M 的內存寫上“Java 佔用”標籤,然後把內存段的起始地址和終止地址給 JVM,JVM 準備加載類文件。

     第 2 步,分配內存內存。JVM 分配內存。JVM 獲得到 64M 內存,就開始得瑟了,首先給 heap 分個內存,然後給棧內存也分配好。

     第 3 步,文件檢查和分析class 文件。若發現有錯誤即返回錯誤。

     第 4 步,加載類。加載類。由於沒有指定加載器,JVM 默認使用 bootstrap 加載器,就把 rt.jar 下的所有類都加載到了堆類存的Method Area,JVMShow 也被加載到內存中。我們來看看Method Area區域,如下圖:(這時候包含了 main 方法和 runStaticMethod方法的符號引用,因爲它們都是靜態方法,在類加載的時候就會加載)Heap 是空,Stack 是空,因爲還沒有對象的新建和線程被執行。

第 5 步、執行方法。執行 main 方法。執行啓動一個線程,開始執行 main 方法,在 main 執行完畢前,方法區如下圖所示:

public final static String ClASS_CONST = "I'm a Const";  )在 Method Area 加入了 CLASS_CONST 常量,它是在第一次被訪問時產生的(runStaticMethod方法內部)。

堆內存中有兩個對象 object 和 showcase 對象,如下圖所示:(執行了JVMShowcase showcase=new JVMShowcase();  )

爲什麼會有 Object 對象呢?是因爲它是 JVMShowcase 的父類,JVM 是先初始化父類,然後再初始化子類,甭管有多少個父類都初始化。

在棧內存中有三個棧幀,如下圖所示:

第 6 步,釋放內存。釋放內存。運行結束,JVM 向操作系統發送消息,說“內存用完了,我還給你”,運行結束

-----------------------------------------

另一篇java內存的解釋,易懂。

預備知識:

1.一個Java文件,只要有main入口方法,我們就認爲這是一個Java程序,可以單獨編譯運行。

2.無論是普通類型的變量還是引用類型的變量(俗稱實例),都可以作爲局部變量,他們都可以出現在棧中。只不過普通類型的變量在棧中直接保存它所對應的值,而引用類型的變量保存的是一個指向堆區的指針,通過這個指針,就可以找到這個實例在堆區對應的對象。因此,普通類型變量只在棧區佔用一塊內存,而引用類型變量要在棧區和堆區各佔一塊內存。

 

示例:(以下所有實例中,是根據需要對於棧內存中的幀棧簡化成了只有局部變量表,實際上由上面對幀棧的介紹知道不僅僅只有這些信息,同理堆內存也一樣)

 

 

1.JVM自動尋找main方法,執行第一句代碼,創建一個Test類的實例,在棧中分配一塊內存,存放一個指向堆區對象的指針110925。

2.創建一個int型的變量date,由於是基本類型,直接在棧中存放date對應的值9。

3.創建兩個BirthDate類的實例d1、d2,在棧中分別存放了對應的指針指向各自的對象。他們在實例化時調用了有參數的構造方法,因此對象中有自定義初始值。

 

 

調用test對象的change1方法,並且以date爲參數。JVM讀到這段代碼時,檢測到i是局部變量,因此會把i放在棧中,並且把date的值賦給i。

 

 

把1234賦給i。很簡單的一步。

 

 

change1方法執行完畢,立即釋放局部變量i所佔用的棧空間。

 

 

調用test對象的change2方法,以實例d1爲參數。JVM檢測到change2方法中的b參數爲局部變量,立即加入到棧中,由於是引用類型的變量,所以b中保存的是d1中的指針,此時b和d1指向同一個堆中的對象。在b和d1之間傳遞是指針。

 

 

change2方法中又實例化了一個BirthDate對象,並且賦給b。在內部執行過程是:在堆區new了一個對象,並且把該對象的指針保存在棧中的b對應空間,此時實例b不再指向實例d1所指向的對象,但是實例d1所指向的對象並無變化,這樣無法對d1造成任何影響。

 

 

change2方法執行完畢,立即釋放局部引用變量b所佔的棧空間,注意只是釋放了棧空間,堆空間要等待自動回收。

 

 

調用test實例的change3方法,以實例d2爲參數。同理,JVM會在棧中爲局部引用變量b分配空間,並且把d2中的指針存放在b中,此時d2和b指向同一個對象。再調用實例b的setDay方法,其實就是調用d2指向的對象的setDay方法。

 

 

調用實例b的setDay方法會影響d2,因爲二者指向的是同一個對象。

 

 

change3方法執行完畢,立即釋放局部引用變量b。

 

以上就是Java程序運行時內存分配的大致情況。其實也沒什麼,掌握了思想就很簡單了。無非就是兩種類型的變量:基本類型和引用類型。二者作爲局部變量,都放在棧中,基本類型直接在棧中保存值,引用類型只保存一個指向堆區的指針,真正的對象在堆裏。作爲參數時基本類型就直接傳值,引用類型傳指針。

小結:

1.分清什麼是實例什麼是對象。Class a= new Class();此時a叫實例,而不能說a是對象。實例在棧中,對象在堆中,操作實例實際上是通過實例的指針間接操作對象。多個實例可以指向同一個對象。

2.棧中的數據和堆中的數據銷燬並不是同步的。方法一旦結束,棧中的局部變量立即銷燬,但是堆中對象不一定銷燬。因爲可能有其他變量也指向了這個對象,直到棧中沒有變量指向堆中的對象時,它才銷燬,而且還不是馬上銷燬,要等垃圾回收掃描時纔可以被銷燬。

3.以上的棧、堆、代碼段、數據段等等都是相對於應用程序而言的。每一個應用程序都對應唯一的一個JVM實例,每一個JVM實例都有自己的內存區域,互不影響。並且這些內存區域是所有線程共享的。這裏提到的棧和堆都是整體上的概念,這些堆棧還可以細分。

4.類的成員變量在不同對象中各不相同,都有自己的存儲空間(成員變量在堆中的對象中)。而類的方法卻是該類的所有對象共享的,只有一套,對象使用方法的時候方法才被壓入棧,方法不使用則不佔用內存。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章