本文基於 JDK1.8 闡述分析
運行過程
我們都知道 Java 源文件通過編譯器編譯後,能產生相應的 .Class 文件,也就是字節碼文件。而字節碼文件通過 Java 虛擬機中的解釋器,編譯成特定機器上的機器碼。
跨平臺的特性
Java 能跨平臺的原因是因爲:不同的平臺有不同的 JVM 版本,一個 Java 源文件被編譯成字節碼文件,被不同平臺的 JVM 翻譯成特定平臺下的機器碼從而運行。
Java 虛擬機組成
Java 虛擬機由三個子系統構成,分別是類加載子系統、JVM 運行時數據區和執行引擎,本文的重點是在 JVM 運行時數據區。
類加載子系統將硬盤上的字節碼文件加載進內存,JVM 運行內存有一套自己的結構劃分如圖所示,最終程序要運行,需要操作系統分配相應的時間調度,由執行引擎去執行,才能得到最終結果。
線程共享數據:允許被所有線程共享訪問的一塊內存區域。
線程私有數據:本線程私有的一塊內存區域
虛擬機棧(JVM Stacks)
-
Java 虛擬機棧是線程私有的,它的生命週期與線程相同,線程啓動而產生,線程結束而消亡。
-
Java 虛擬機棧是描述 Java 方法執行的內存模型,用於存儲棧幀。
-
如果線程請求的棧深度大於虛擬機所允許的深度,將拋出 StackOverflowError 異常。
-
虛擬機棧可以動態擴展,如果擴展時無法申請到足夠的內存,就會拋出 OutOfMemoryError 異常。
-
除了 native 方法,幾乎所有的 Java 方法都是通虛擬機棧來實現方法的調用和執行(需要程序計數器、堆、方法區的配合)。
-
棧幀(Stack Frame)
- 每個方法執行的同時會創建一個棧幀,它是虛擬機棧的基本元素。
- 一個方法從調用到執行完成的過程,就對應着一個棧幀在虛擬機棧中入棧到出棧的過程。
- 在活動線程中,只有位於棧頂的棧幀纔是有效的,稱爲當前棧幀,與這個棧幀相關聯的方法稱爲當前方法。執行引擎運行的所有字節碼指令都只針對當前棧幀進行操作。
- 棧幀隨着方法調用而創建,隨着方法結束而銷燬。
- 每一個棧幀包含的內容有局部變量表、操作數棧、動態鏈接、方法返回地址和一些額外的附加信息。
-
局部變量表(Local Variable Table)
- 一組變量值存儲空間,用於存放方法參數和方法內定義的局部變量。
- 該方法所需要分配的局部變量表的最大容量在將 Java 編譯爲 Class 文件時已經確定。
- 一個局部變量表保存的是編譯期可知的各種基本數據類型、對象引用和 returnAddress 類型(它指向了一條字節碼指令的地址)。
- 局部變量表的容量以變量槽爲最小單位,每個變量槽可以存儲32位長度的內存空間。對於64位長度的數據類型(long,double),虛擬機會以高位對齊方式爲其分配兩個連續的變量糙空間。
- 局部變量表所需的內存空間在編譯期間就能完成分配,在運行期間不會改變其大小。
- 虛擬機通過索引定位的方法查找相應的局部變量
-
操作數棧(Operand Stack)
- 虛擬機棧中的一個用於計算的臨時數據存儲區。
- 隨着方法執行和字節碼指令的執行,會從局部變量表或對象實例的字段中複製常量或變量寫入到操作數棧,再隨着計算的進行將棧中元素出棧到局部變量表或者返回給方法調用者,也就是出棧/入棧操作。
-
動態鏈接(Dynamic Linking)
- 在一個class文件中,一個方法要調用其他方法,需要將這些方法的符號引用轉化爲其在內存地址中的直接引用,而符號引用存在於運行時常量池。
- 每個棧幀都包含一個指向運行時常量池中該棧所屬方法的符號引用。
- 這些符號引用一部分會在類加載階段或者第一次使用時就直接轉化爲直接引用,這類轉化稱爲靜態解析。另一部分將在每次運行期間轉化爲直接引用,這類轉化稱爲動態連接。
-
方法返回
- 一個方法開始執行後,只有兩種退出方式:正常完成出口和異常完成出口
- 正常完成出口指方法正常完成並退出,根據當前方法返回的字節碼指令,這時有可能會有返回值傳遞給方法調用者(調用它的方法),或者無返回值。
- 異常完成出口指方法執行過程中遇到異常,並且這個異常在方法體內部沒有得到處理,導致方法退出。
- 無論採用何種退出方式,在方法退出後,都需要返回到方法被調用的位置,方法返回時可能需要在棧幀中保存一些信息。
- 一般來說,方法正常退出時,調用者的程序計數器的值可以作爲返回地址,棧幀中會保存這個計數器值。而方法異常退出時,返回地址要通過異常處理器表來確定,棧幀中一般不保存這部分信息。
-
附加信息
- 虛擬機規範允許具體的虛擬機實現增加一些規範中沒有描述的信息到棧幀之中,例如和調試相關的信息,這部分信息完全取決於不同的虛擬機實現。
- 在實際開發中,一般會把動態連接,方法返回地址與其他附加信息一起歸爲一類,稱爲棧幀信息。
程序計數器(Program Counter Register)
程序計數器是一塊較小的內存空間,它可以看作是當前線程所執行的字節碼的行號指示器。在虛擬機的概念模型裏,字節碼解釋器工作時就是通過改變這個計數器的值來選取下一條需要執行的字節碼指令。分支、循環、跳轉、異常處理、線程恢復等基礎功能都需要依賴這個計數器來完成。
-
程序計數器是線程私有的
JVM 的多線程是通過線程輪流切換並分配處理器執行時間的方式來實現,在同一時刻一個處理器內核只會執行一條線程,處理器切換線程時並不會記錄上一個線程執行到哪個位置,所以爲了線程切換後依然能恢復到原位,每條線程都需要有各自獨立的程序計數器。
-
JVM 規範中唯一沒有規定 OutOfMemoryError 情況的區域
程序計數器存儲的是字節碼文件的行號,而這個範圍是可知曉的,在一開始分配內存時就可以分配一個絕對不會溢出的內存。
-
執行 Native 方法時計數器值爲空
當執行 Java 方法時,程序計數器存放 Java 字節碼的地址。實現上可能有兩種形式,一種是相對該方法字節碼開始處的偏移量,叫做 bytecode index(簡稱 bci)。另一種是該 Java 字節碼指令在內存的地址,叫做 bytecode pointer(簡稱 bcp)。
Native 方法大多通過 C 實現,它的方法體不是由 Java 字節碼構成,無法應用上述 Java 字節碼地址的概念,也就不需要存儲字節碼文件的行號。
-
Native 方法的實際執行
Java 線程總是需要以某種形式映射到 OS 線程上,HotSpot VM 目前在大多數平臺上都使用 1:1 模型(原生線程模型),也就是每個 Java 線程直接映射到一個 OS 線程上執行。此時 native 方法由原生平臺直接執行。
本地方法棧(Native Method Stacks)
本地方法棧爲虛擬機使用到的 Native 方法服務。Native 方法是 Java 通過 JNI 直接調用本地 C/C++ 庫,可以認爲是 Native 方法相當於 C/C++ 暴露給 Java 的一個接口,Java 通過調用這個接口從而調用 C/C++ 方法。與虛擬機棧一樣,本地方法棧區域也會拋出 StackOverflowError 和 OutOfMemoryError 異常。
-
Java 程序調用本地方法
不同於虛擬機棧的入/出棧,當線程調用 native 方法時,虛擬機只是簡單地動態連接並直接調用指定的 native 方法。
-
本地方法接口回調 JVM 中的 Java 方法
如果某個虛擬機實現的本地方法接口是使用 C 連接模型的話,那個他的本地方法棧就是 C 棧,當一個 C 函數調用另一個 C 函數時,它的棧操作是確定的。如果本地方法接口需要回調JVM 中的 Java 方法,該線程會保存本地方法棧的狀態並進入到另一個Java棧。
-
不同虛擬機的不同實現
虛擬機規範中對本地方法棧中的方法使用的語言、使用方式與數據結構並沒有強制規定,因此具體的虛擬機可以自由實現它。常用的 HotSpot 虛擬機選擇合併了虛擬機棧和本地方法棧。
堆(Heap)
堆是 JVM 所管理的最大的一塊內存空間,主要用於存放各種類的實例對象。堆可以處於物理上不連續的內存空間中,只要邏輯上是連續的即可,就像我們的磁盤空間一樣。
-
分代概念
- JVM 中堆空間由新生代和老年代兩個區組成
- 新生代可以劃分爲三個區,Eden 區,兩個 Survivor 區
- Eden = 8/10 的新生代空間大小,from = to = 1/10 的新生代空間大小。
- JVM 每次只會使用 Eden 和其中的一塊 Survivor 區域來爲對象服務,所以無論什麼時候,總是有一塊 Survivor 區域是空閒着的。
-
常用參數配置
參數 說明 -Xms 堆內存初始大小 -Xmx 堆內存最大允許大小 -Xss 每個線程的 Stack 大小 -XX:NewSize(-Xns) 新生代初始大小 -XX:MaxNewSize(-Xmn) 新生代最大允許大小 -XX:NewRatio 設置新生代與老年代比值 -XX:SurvivorRatio 設置 Survivor 與 Eden 比值 -XX:PermSize 設置持久代初始內存大小(JDK8 以前) -XX:MaxPermSize 設置持久代最大內存(JDK8 以前) -XX:MetaspaceSize 設置元空間初始內存大小(JDK8 以後) -XX:MaxMetaspaceSize 設置元空間最大內存(JDK8 以後) -
堆 GC
在堆中分配的內存,由 JVM 自動垃圾回收器來管理。關於 GC 詳情,之後再補充。
方法區(Method Area)
方法區是一種規範,不同的虛擬機的實現也不一樣。從 JDK 1.8 開始,元空間(Metaspace)取代了永久代(PermGen)成爲 HotSpot VM 對方法區的實現。方法區存儲加載進來的每一個類的結構信息,可以看做是將類(Class)的模板信息,保存在方法區裏