Java虛擬機4:Java對象創建和對象訪問

1.對象創建

Java是一門面向對象的語言,Java程序運行過程中無時無刻都有對象被創建出來。在語言層面上,創建對象(克隆、反序列化)就是一個new關鍵字而已,但是虛擬機層面上卻不是如此。看一下在虛擬機層面上創建對象的步驟:

對象的建立過程 
 
              圖一:對象建立過程 
1、類加載檢查。 
當JVM檢測到有一條new指令時,首先先檢查該指令的參數是否在常量池中定位到一個類的符號引用,並檢查這個符號引用所代表的類是否已被加載、解析和初始化過。如果存在的話,JVM將直接使用已有的信息對該類進行操作。 
如果沒有,則執行相應的類加載過程。 
2、虛擬機爲新生對象分配內容(位於堆中)。 

類加載檢查通過後,虛擬機爲新生對象分配內存對象所需內存大小在類加載完成後便可以完全確定,爲對象分配空間無非就是從Java堆中劃分出一塊確定大小的內存而已。

不同的JVM垃圾收集器在分配內存時的表現也不相同,具體表現爲兩種:

(1)如果垃圾收集器選擇的是Serial、ParNew這種基於壓縮整理算法的,那麼內存是規整的,虛擬機將採用的是指針碰撞法來爲對象分配內存。意思是所有用過的內存在一邊,空閒的內存在另外一邊,中間放着一個指針作爲分界點的指示器,分配內存就僅僅是把指針向空閒那邊挪動一段與對象大小相等的距離罷了。

(2)如果垃圾收集器選擇的是CMD這種基於標記-清除算法的,那麼內存不是規整的,已使用的內存和未使用的內存相互交錯,虛擬機將採用的是空閒列表法來爲對象分配內存。意思是虛擬機維護了一個列表,記錄上哪些內存塊是可用的以及內存塊的位置和大小,再分配的時候從列表中找到一塊足夠大的空間劃分給對象實例,並更新列表上的內容。

另外一個問題是new對象時的線程安全性,也就是內存分配時的同步問題。因爲可能出現虛擬機正在給對象A分配內存,指針還沒有來得及修改,對象B又同時使用了原來的指針來分配內存的情況。這種情況下虛擬機會通過兩種方式進行同步:

a、CAS和失敗重試機制:對分配內存空間的動作進行同步處理,虛擬機採用CAS配上失敗重試的方式保證更新操作的原子性。CAS簡單解釋就是:比較並交換,通過3\操作數,內存值V,舊的預期值A,要修改的新值B。當且僅當預期值A和內存值V相同時,將內存值V修改爲B,否則什麼都不做。

b、TLAB方式:把內存的分配動作按照線程劃分在不同的空間之中進行,即每個線程在Java堆中先預留一塊本地線程分配緩衝(TLAB)。哪個線程分配內存時,就在哪個線程的TLAB分配,只有當TLAB用完並分配新的TLAB時,才需要同步鎖定。

3、內存分配結束。

內存分配結束,虛擬機將分配到的內存空間都初始化爲零值(不包括對象頭)。這一步保證了對象的實例字段在Java代碼中可以不用賦初始值就可以直接使用,程序能訪問到這些字段的數據類型所對應的零值。

4、對對象進行必要的設置。 

對對象進行必要的設置,例如這個對象是哪個類的實例、如何才能找到類的元數據信息、對象的哈希碼、對象的GC分代年齡等信息。這些信息存放在對象的對象頭之中。 
5、初始化對象(執行<init>方法)。 
當完成上述操作後,對象的內存便分配成功了,但是所有的字段都還是零。 
此時應該執行<init>方法,把對象按照程序員的意願進行初始化,從而產生一個真正可用的對象。

下面我們再將上面的過程,重新畫一張圖,總結一下:

2.對象的內存佈局

對象的內存佈局分爲三個區域: 
a、對象頭,b、實例數據,c、對齊填充。

  • 對象頭:非固定的數據結構。一來是用來存儲對象自身的運行時數據,如哈希碼、GC分代年齡、鎖狀態標誌、線程持有的鎖、偏向線程ID、偏向時間戳等。二來是類型指針,即對象指向它的類元數據的指針、JVM通過這個指針來確定這個對象是哪個類的實例。如果對象是一個Java數組,則在對象頭中還需要有一塊記錄數組長度數據。
  • 實例數據:存儲對象真正有效的信息,也就是程序代碼中所定義的各種類型的字段內容。不論是從父類繼承下來的,還是在子類中定義的。這部分的存儲順序會受到Java源碼中定義順序的影響。
  • 對齊填充:不一定必須存在。啓到佔位符的作用。因爲JVM的自動內存管理系統要求對象的起始地址必須是8字節的整數倍,即對象的大小必須是8字節的整數倍。故當對象實例數據部分沒有對齊時,就需要通過對齊填充來補全。

3.對象的訪問方式

建立對象是爲了使用對象,Java程序需要通過棧上的reference(引用)數據來操作堆上的具體對象。對象訪問會涉及到Java棧、Java堆、方法區這三個內存區域。

如下面這句代碼:

Object obj =  new Object();

上面對象實例化的其實有兩部分內容,一部分是類數據(比如代表類的Class對象)、一部分是實例數據

假如這句代碼出現在方法體中,"Object obj" 這部分會作爲引用類型(reference)的數據保存在Java棧的本地變量表中。而"new Object()"這部分實例化對象將會反映到Java堆中,形成一塊存儲Object實例化對象的所有實例數據值的結構化內存,根據具體數據類型以及虛擬機實現的對象內存佈局的不同,這塊內存的長度是不固定的。另外,在Java堆中還必須包含能查到此對象類型數據(如對象類型、父類、實現的接口、方法等)的地址信息,這些數據類型則存儲在方法區中。

reference類型在java虛擬機規範裏面只規定了一個指向對象的引用地址,並沒有定義這個引用應該通過哪種方式去定位,訪問到java堆中的對象位置,因此不同的虛擬機實現的訪問方式可能不同,

主流的方式有兩種:使用句柄和直接指針:

1、使用句柄訪問,Java堆中將會劃分出一塊內存來作爲句柄池,obj(reference引用)中存儲的是對象的句柄地址,而句柄中包含了類數據的地址和對象實例數據的地址。
2、直接指針訪問,Java堆中也就是對象中存儲所有的實例數據和類數據的地址,此時obj(reference引用)存放的是對象地址。 
兩種訪問方式的對比:

  • 使用句柄時,當改變句柄中的實例數據指針時,reference本身不需要被修改。
  • 使用直接指針訪問最大的好處在於速度較快,因爲其節省了一次指針定位的時間開銷。

目前使用直接指針訪問的方式比較常用,HotSpot虛擬機採用的是後者,因爲對象的訪問在Java程序運行過程中是比較頻繁的,積少成多也會造成太多的時間開銷。不過前者的對象訪問方式也是十分常見的。

 下面拷貝兩張圖,明白一下對象的兩種訪問方式:

轉載:http://www.cnblogs.com/zhouyuqin/p/5161680.html

http://blog.csdn.net/java2000_wl/article/details/8015105

http://blog.csdn.net/ns_code/article/details/17565503

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章