Java對象結構與鎖實現原理及MarkWord詳解

閱讀本博客前,需要了解基本的同步概念,傳送門http://note.youdao.com/noteshare?id=7f10475c6bb01658b955eaca531c0be6&sub=590214A72B3C455FAB266C4FB7A32698

我們都知道,Java對象存儲在堆(Heap)內存。那麼一個Java對象到底包含什麼呢?概括起來分爲對象頭、對象體和對齊字節。如下圖所示:

對象的幾個部分的作用:

1.對象頭中的Mark Word(標記字)主要用來表示對象的線程鎖狀態,另外還可以用來配合GC、存放該對象的hashCode;

2.Klass Word是一個指向方法區中Class信息的指針,意味着該對象可隨時知道自己是哪個Class的實例;

3.數組長度也是佔用64位(8字節)的空間,這是可選的,只有當本對象是一個數組對象時纔會有這個部分;

4.對象體是用於保存對象屬性和值的主體部分,佔用內存空間取決於對象的屬性數量和類型;

5.對齊字是爲了減少堆內存的碎片空間(不一定準確)。

瞭解了對象的總體結構,接下來深入地瞭解對象頭的三個部分。

一、Mark Word(標記字)

Java對象的狀態主要靠Mark Word來標記,主要有5種,大部分與線程有關。這裏以64位JVM爲例:

以上是Java對象處於5種不同狀態時,Mark Word中64個位的表現形式,上面每一行代表對象處於某種狀態時的樣子。其中各部分的含義如下:

lock:2位的鎖狀態標記位,由於希望用儘可能少的二進制位表示儘可能多的信息,所以設置了lock標記。該標記的值不同,整個Mark Word表示的含義不同。biased_locklock一起,表達的鎖狀態含義如下:

biased_lock       lock            狀態

0                        01              無鎖

1                        01              偏向鎖

                          00              輕量級鎖

                          10              重量級鎖

                          11              GC標記

 

biased_lock:對象是否啓用偏向鎖標記,只佔1個二進制位。爲1時表示對象啓用偏向鎖,爲0時表示對象沒有偏向鎖。lock和biased_lock共同表示對象處於什麼鎖狀態。

age:4位的Java對象年齡。在GC中,如果對象在Survivor區複製一次,年齡增加1。當對象達到設定的閾值時,將會晉升到老年代。默認情況下,並行GC的年齡閾值爲15,併發GC的年齡閾值爲6。由於age只有4位,所以最大值爲15,這就是-XX:MaxTenuringThreshold選項最大值爲15的原因。

identity_hashcode:31位的對象標識hashCode,採用延遲加載技術。調用方法System.identityHashCode()計算,並會將結果寫到該對象頭中。當對象加鎖後(偏向、輕量級、重量級),MarkWord的字節沒有足夠的空間保存hashCode,因此該值會移動到管程Monitor中。

thread:持有偏向鎖的線程ID。

epoch:偏向鎖的時間戳。

ptr_to_lock_record:輕量級鎖狀態下,指向棧中鎖記錄的指針。

ptr_to_heavyweight_monitor:重量級鎖狀態下,指向對象監視器Monitor的指針。

        我們通常說的通過synchronized實現的同步鎖,真實名稱叫做重量級鎖。但是重量級鎖會造成線程排隊(串行執行),且會使CPU在用戶態和核心態之間頻繁切換,所以代價高、效率低。爲了提高效率,不會一開始就使用重量級鎖,JVM在內部會根據需要,按如下步驟進行鎖的升級:

        1.初期鎖對象剛創建時,還沒有任何線程來競爭,對象的Mark Word是下圖的第一種情形,這偏向鎖標識位是0,鎖狀態01,說明該對象處於無鎖狀態(無線程競爭它)。

        2.當有一個線程來競爭鎖時,先用偏向鎖,表示鎖對象偏愛這個線程,這個線程要執行這個鎖關聯的任何代碼,不需要再做任何檢查和切換,這種競爭不激烈的情況下,效率非常高。這時Mark Word會記錄自己偏愛的線程的ID,把該線程當做自己的熟人。如下圖第二種情形。

        3.當有兩個線程開始競爭這個鎖對象,情況發生變化了,不再是偏向(獨佔)鎖了,鎖會升級爲輕量級鎖,兩個線程公平競爭,哪個線程先佔有鎖對象並執行代碼,鎖對象的Mark Word就執行哪個線程的棧幀中的鎖記錄。如下圖第三種情形。

        4.如果競爭的這個鎖對象的線程更多,導致了更多的切換和等待,JVM會把該鎖對象的鎖升級爲重量級鎖,這個就叫做同步鎖,這個鎖對象Mark Word再次發生變化,會指向一個監視器對象,這個監視器對象用集合的形式,來登記和管理排隊的線程。如下圖第四種情形。

        如果線程競爭鎖以圖的方式來單獨描述的話,鎖對象處於5種狀態下的Mark Word分別表現如下:

 

二、Klass Word(類指針)

這一部分用於存儲對象的類型指針,該指針指向它的類元數據,JVM通過這個指針確定對象是哪個類的實例。該指針的位長度爲JVM的一個字大小,即32位的JVM爲32位,64位的JVM爲64位。

如果應用的對象過多,使用64位的指針將浪費大量內存,統計而言,64位的JVM將會比32位的JVM多耗費50%的內存。爲了節約內存可以使用選項+UseCompressedOops開啓指針壓縮,其中,oop即ordinary object pointer普通對象指針。開啓該選項後,下列指針將壓縮至32位:

  1. 每個Class的屬性指針(即靜態變量)
  2. 每個對象的屬性指針(即對象變量)
  3. 普通對象數組的每個元素指針

當然,也不是所有的指針都會壓縮,一些特殊類型的指針JVM不會優化,比如指向PermGen的Class對象指針(JDK8中指向元空間的Class對象指針)、本地變量、堆棧元素、入參、返回值和NULL指針等。

 

三、數組長度

如果對象是一個數組,那麼對象頭還需要有額外的空間用於存儲數組的長度,這部分數據的長度也隨着JVM架構的不同而不同:32位的JVM上,長度爲32位;64位JVM則爲64位。64位JVM如果開啓+UseCompressedOops選項,該區域長度也將由64位壓縮至32位。

by@六噸代碼

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章