重識JVM(二):虛擬機對象相關

1.對象的創建

在語言層面,創建一個對象通常是new一個關鍵字,那麼在java虛擬機中,對象的創建過程又是怎樣的呢?

(1)虛擬機遇到一條new 指令時,首先將去檢查這個指令的參數是否能在常量池中定位到一個類的符號引用,並且檢查這個符號引用代表的類是否已被加載、解析和初始化過。如果沒有,那就執行類加載過程

(2)在類加載檢查通過後,虛擬機將爲新生對象分配內存。對象所需內存的大小在類加載完成後便可確定,爲對象分配空間的任務等同於把一塊確定大小的內存從Java 堆中劃分出來。假設Java 堆中內存是絕對規整的,所有用過的內存都放在一邊,空閒的內存放在另一邊,中間放着一個指針作爲分界點的指示器,那所分配內存就僅僅是把那個指針向空閒空間那邊挪動一塊與對象大小相等的距離,這種分配方式稱爲指針碰撞。如果Java 堆中的內存不是規整的,虛擬機就必須維護一個列表,記錄上哪些內存塊是可用的,在分配的時候從列表中找到一塊足夠大的空間劃分給對象實例,並更新列表上的記錄,這種分配方式稱爲空閒列表(Free List)。選擇哪種分配方式由Java 堆是否規整決定,而Java 堆是否規整又由所採用的垃圾收集器是否帶有壓縮整理功能決定。

(3)除如何劃分可用空間之外,還有另外一個需要考慮的問題是對象創建在虛擬機中是非常頻繁的行爲,即使是僅僅修改一個指針所指向的位置,在併發情況下也不是線程安全的,可能出現正在給對象A 分配內存,指針還沒來得及修改,對象B 又同時使用了原來的指針來分配內存的情況。解決這個問題有兩個方案,一種是對分配內存空間的動作進行同步處理(CAS+重試),另一
種是把內存分配的動作按照線程劃分在不同的空間之中進行,即每個線程在Java 堆中預先分配一小塊內存,稱爲本地線程分配緩衝TLAB。哪個線程分配內存,就在哪個線程的TLAB上分配,只有TLAB 用完並分配新的TLAB 時,才需要同步鎖定

(4)內存分配完成後,虛擬機需要將分配到的內存空間都初始化爲零值。接下來,虛擬機要對對象進行必要的設置,例如這個對象是哪個類的實例、如何找到類的元數據等信息。這些信息存放在對象的對象頭之中。上述工作完成後,從虛擬機的視角來看,一個新的對象已經產生,但從Java 程序的視角來看,構造方法還沒有執行,字段都還爲0。所以執行new 指令之後會接着執行構造方法等,這樣一個對象纔算真正產生出來。

2.對象的內存佈局

在HotSpot 虛擬機中,對象在內存中存儲的佈局可以分爲3 個區域:對象頭(Header)、實例數據(Instance Data)和對齊填充(Padding)。
對象頭包括兩部分信息,第一部分用於存儲對象自身的運行時數據,如哈希碼、GC 分代年齡、鎖狀態標誌等。對象頭的另一部分是類型指針,即對象指向它的類元數據的指針,虛擬機通過這個指針來確定這個對象是哪個類的實例。實例數據是對象真正存儲的有效信息,也是在程序代碼中所定義的各種類型的字段內容。無論是從父類繼承的,還是在子類中定義的,都需要記錄下來。相同寬度的字段總是被分配到一起,在這個前提下,在父類中定義的變量會出現在子類之前。對齊填充並不是必然存在的,它僅僅起着佔位符的作用,HotSpot 虛擬機的自動內存管理系統要求對象起始地址必須是8 字節的整數倍,即對象大小必須是8 字節的整數倍,而對象頭正好是8 字節的整數倍。因此,當對象實例數據部分沒有對齊時,就需要對齊填充來補全

3.對象的訪問定位

Java 程序需要通過棧上的Reference 數據來操作堆上的具體對象。由於Reference 類型在Java虛擬機規範中只規定了一個指向對象的引用,並沒有定義這個引用應該通過何種方式來定位、訪問堆中對象的具體位置,所以對象訪問方式也是取決於虛擬機實現而定的。目標主流的方式有使用句柄直接指針兩種。
如果使用句柄訪問的話,那麼Java 堆中將會劃分出一塊內存來作爲句柄池,Reference 中存儲的就是對象的句柄地址,而句柄中包含了對象實例數據和類型數據各自的具體地址信息。如下圖所示:

如果使用直接指針訪問,那麼Java 堆對象的佈局中就必須考慮如何放置訪問類型數據的相關信息,而Reference 中存儲的直接就是對象地址。如下圖所示:

使用句柄來訪問的最大好處就是Reference 中存儲的是穩定的句柄地址,在對象被移動時(垃圾收集時移動對象時非常普遍的)只會改變句柄中的實例數據指針,而Reference 本身不需要修改。
使用直接指針訪問方式的最大好處就是速度更快,它節省了一次指針定位的時間開銷。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章