點擊上方“碼農突圍”,馬上關注
這裏是碼農充電第一站,回覆“666”,獲取一份專屬大禮包
真愛,請設置“星標”或點個“在看
來源 | https://urlify.cn/ruYFJv
Java 語言的每個關鍵字都設計的很巧妙,金雕玉琢,只有深度鑽研其中,才知其中懊悔,本文帶領大家一起深入理解 Java 內存模型之 final。
與鎖和 volatile 相比較,對 final 域的讀和寫更像是普通的變量訪問。對於 final 域,編譯器和處理器要遵守兩個重排序規則:
在構造函數內對一個 final 域的寫入,與隨後把這個被構造對象的引用賦值給一個引用變量,這兩個操作之間不能重排序。
初次讀一個包含 final 域的對象的引用,與隨後初次讀這個 final 域,這兩個操作之間不能重排序。
下面,我們通過一些示例性的代碼來分別說明這兩個規則:
public class FinalExample {
int i; // 普通變量
final int j; //final 變量
static FinalExample obj;
public void FinalExample () { // 構造函數
i = 1; // 寫普通域
j = 2; // 寫 final 域
}
public static void writer () { // 寫線程 A 執行
obj = new FinalExample ();
}
public static void reader () { // 讀線程 B 執行
FinalExample object = obj; // 讀對象引用
int a = object.i; // 讀普通域
int b = object.j; // 讀 final 域
}
}
這裏假設一個線程 A 執行 writer () 方法,隨後另一個線程 B 執行 reader () 方法。下面我們通過這兩個線程的交互來說明這兩個規則。
寫 final 域的重排序規則
寫 final 域的重排序規則禁止把 final 域的寫重排序到構造函數之外。這個規則的實現包含下面 2 個方面:
JMM 禁止編譯器把 final 域的寫重排序到構造函數之外。
編譯器會在 final 域的寫之後,構造函數 return 之前,插入一個 StoreStore 屏障。這個屏障禁止處理器把 final 域的寫重排序到構造函數之外。
現在讓我們分析 writer () 方法。writer () 方法只包含一行代碼:finalExample = new FinalExample ()。這行代碼包含兩個步驟:
構造一個 FinalExample 類型的對象;
把這個對象的引用賦值給引用變量 obj。
假設線程 B 讀對象引用與讀對象的成員域之間沒有重排序(馬上會說明爲什麼需要這個假設),下圖是一種可能的執行時序:
在上圖中,寫普通域的操作被編譯器重排序到了構造函數之外,讀線程 B 錯誤的讀取了普通變量 i 初始化之前的值。而寫 final 域的操作,被寫 final 域的重排序規則“限定”在了構造函數之內,讀線程 B 正確的讀取了 final 變量初始化之後的值。
寫 final 域的重排序規則可以確保:在對象引用爲任意線程可見之前,對象的 final 域已經被正確初始化過了,而普通域不具有這個保障。以上圖爲例,在讀線程 B“看到”對象引用 obj 時,很可能 obj 對象還沒有構造完成(對普通域 i 的寫操作被重排序到構造函數外,此時初始值 2 還沒有寫入普通域 i)。
讀 final 域的重排序規則
讀 final 域的重排序規則如下:
在一個線程中,初次讀對象引用與初次讀該對象包含的 final 域,JMM 禁止處理器重排序這兩個操作(注意,這個規則僅僅針對處理器)。編譯器會在讀 final 域操作的前面插入一個 LoadLoad 屏障。
初次讀對象引用與初次讀該對象包含的 final 域,這兩個操作之間存在間接依賴關係。由於編譯器遵守間接依賴關係,因此編譯器不會重排序這兩個操作。大多數處理器也會遵守間接依賴,大多數處理器也不會重排序這兩個操作。但有少數處理器允許對存在間接依賴關係的操作做重排序(比如 alpha 處理器),這個規則就是專門用來針對這種處理器。
reader() 方法包含三個操作:
初次讀引用變量 obj;
初次讀引用變量 obj 指向對象的普通域 j。
初次讀引用變量 obj 指向對象的 final 域 i。
現在我們假設寫線程 A 沒有發生任何重排序,同時程序在不遵守間接依賴的處理器上執行,下面是一種可能的執行時序:
在上圖中,讀對象的普通域的操作被處理器重排序到讀對象引用之前。讀普通域時,該域還沒有被寫線程 A 寫入,這是一個錯誤的讀取操作。而讀 final 域的重排序規則會把讀對象 final 域的操作“限定”在讀對象引用之後,此時該 final 域已經被 A 線程初始化過了,這是一個正確的讀取操作。
讀 final 域的重排序規則可以確保:在讀一個對象的 final 域之前,一定會先讀包含這個 final 域的對象的引用。在這個示例程序中,如果該引用不爲 null,那麼引用對象的 final 域一定已經被 A 線程初始化過了。
# 如果 final 域是引用類型
上面我們看到的 final 域是基礎數據類型,下面讓我們看看如果 final 域是引用類型,將會有什麼效果?
請看下列示例代碼:
public class FinalReferenceExample {
final int[] intArray; //final 是引用類型
static FinalReferenceExample obj;
public FinalReferenceExample () { // 構造函數
intArray = new int[1]; //1
intArray[0] = 1; //2
}
public static void writerOne () { // 寫線程 A 執行
obj = new FinalReferenceExample (); //3
}
public static void writerTwo () { // 寫線程 B 執行
obj.intArray[0] = 2; //4
}
public static void reader () { // 讀線程 C 執行
if (obj != null) { //5
int temp1 = obj.intArray[0]; //6
}
}
}
這裏 final 域爲一個引用類型,它引用一個 int 型的數組對象。對於引用類型,寫 final 域的重排序規則對編譯器和處理器增加了如下約束:
在構造函數內對一個 final 引用的對象的成員域的寫入,與隨後在構造函數外把這個被構造對象的引用賦值給一個引用變量,這兩個操作之間不能重排序。
對上面的示例程序,我們假設首先線程 A 執行 writerOne() 方法,執行完後線程 B 執行 writerTwo() 方法,執行完後線程 C 執行 reader () 方法。下面是一種可能的線程執行時序:
在上圖中,1 是對 final 域的寫入,2 是對這個 final 域引用的對象的成員域的寫入,3 是把被構造的對象的引用賦值給某個引用變量。這裏除了前面提到的 1 不能和 3 重排序外,2 和 3 也不能重排序。
JMM 可以確保讀線程 C 至少能看到寫線程 A 在構造函數中對 final 引用對象的成員域的寫入。即 C 至少能看到數組下標 0 的值爲 1。而寫線程 B 對數組元素的寫入,讀線程 C 可能看的到,也可能看不到。JMM 不保證線程 B 的寫入對讀線程 C 可見,因爲寫線程 B 和讀線程 C 之間存在數據競爭,此時的執行結果不可預知。
如果想要確保讀線程 C 看到寫線程 B 對數組元素的寫入,寫線程 B 和讀線程 C 之間需要使用同步原語(lock 或 volatile)來確保內存可見性。
爲什麼 final 引用不能從構造函數內“逸出”
前面我們提到過,寫 final 域的重排序規則可以確保:在引用變量爲任意線程可見之前,該引用變量指向的對象的 final 域已經在構造函數中被正確初始化過了。其實要得到這個效果,還需要一個保證:在構造函數內部,不能讓這個被構造對象的引用爲其他線程可見,也就是對象引用不能在構造函數中“逸出”。爲了說明問題,讓我們來看下面示例代碼:
public class FinalReferenceEscapeExample {
final int i;
static FinalReferenceEscapeExample obj;
public FinalReferenceEscapeExample () {
i = 1; //1 寫 final 域
obj = this; //2 this 引用在此“逸出”
}
public static void writer() {
new FinalReferenceEscapeExample ();
}
public static void reader {
if (obj != null) { //3
int temp = obj.i; //4
}
}
}
假設一個線程 A 執行 writer() 方法,另一個線程 B 執行 reader() 方法。這裏的操作 2 使得對象還未完成構造前就爲線程 B 可見。即使這裏的操作 2 是構造函數的最後一步,且即使在程序中操作 2 排在操作 1 後面,執行 read() 方法的線程仍然可能無法看到 final 域被初始化後的值,因爲這裏的操作 1 和操作 2 之間可能被重排序。實際的執行時序可能如下圖所示:
從上圖我們可以看出:在構造函數返回前,被構造對象的引用不能爲其他線程可見,因爲此時的 final 域可能還沒有被初始化。在構造函數返回後,任意線程都將保證能看到 final 域正確初始化之後的值。
# final 語義在處理器中的實現
現在我們以 x86 處理器爲例,說明 final 語義在處理器中的具體實現。
上面我們提到,寫 final 域的重排序規則會要求譯編器在 final 域的寫之後,構造函數 return 之前,插入一個 StoreStore 障屏。讀 final 域的重排序規則要求編譯器在讀 final 域的操作前面插入一個 LoadLoad 屏障。
由於 x86 處理器不會對寫 - 寫操作做重排序,所以在 x86 處理器中,寫 final 域需要的 StoreStore 障屏會被省略掉。同樣,由於 x86 處理器不會對存在間接依賴關係的操作做重排序,所以在 x86 處理器中,讀 final 域需要的 LoadLoad 屏障也會被省略掉。也就是說在 x86 處理器中,final 域的讀 / 寫不會插入任何內存屏障!
JSR-133 爲什麼要增強 final 的語義
在舊的 Java 內存模型中 ,最嚴重的一個缺陷就是線程可能看到 final 域的值會改變。比如,一個線程當前看到一個整形 final 域的值爲 0(還未初始化之前的默認值),過一段時間之後這個線程再去讀這個 final 域的值時,卻發現值變爲了 1(被某個線程初始化之後的值)。最常見的例子就是在舊的 Java 內存模型中,String 的值可能會改變(參考文獻 2 中有一個具體的例子,感興趣的讀者可以自行參考,這裏就不贅述了)。
爲了修補這個漏洞,JSR-133 專家組增強了 final 的語義。通過爲 final 域增加寫和讀重排序規則,可以爲 java 程序員提供初始化安全保證:只要對象是正確構造的(被構造對象的引用在構造函數中沒有“逸出”),那麼不需要使用同步(指 lock 和 volatile 的使用),就可以保證任意線程都能看到這個 final 域在構造函數中被初始化之後的值。
重磅!魚哥微信好友坑位限時開放啦!
福利來啦!掃碼直接加魚哥微信號,送你一份刷題指南和麪試手冊,不僅可以圍觀魚哥平時所思和覆盤的內容。還可以幫你免費內推大廠,技術交流,一起探索職場突圍,收入突圍,技術突圍。一定要備註:開發方向+地點+學校/公司+暱稱(如Java開發+上海+拼夕夕+猴子)
▲長按加魚哥微信,趕緊上車
推薦閱讀
• 再見,Lombok,沒想到你纔是讓我們代碼處於了“亞健康”狀態的真正元兇!
• Google 開源的這份工程實踐,GitHub標星14.4k,果然大廠出品,必是精品!
• Java 處理 Exception 的 9 個最佳實踐,你做對了嗎?
最後推薦一個不錯公衆號,由一羣志同道合的BAT一線碼農業餘創建的,帶你發現Github上好玩有趣的項目,如果你也對GitHub開源項目推薦感興趣,也可以在這個公號後臺留言一起入夥哦!
如有收穫,點個在看,誠摯感謝
最近面試BAT,整理一份面試資料《Java面試BAT通關手冊》,覆蓋了Java核心技術、JVM、Java併發、SSM、微服務、數據庫、數據結構等等。
獲取方式:點“在看”,關注公衆號並回復 BAT 領取,更多內容陸續奉上。
明天見(。・ω・。)ノ