【Java】final 域的內存語義

文章來源：《Java併發編程的藝術》

final 域的重排序規則

對於 final 域，編譯器和處理器要遵守兩個重排序規則。

1）在構造函數內對一個 final 域的寫入，與隨後把這個被構造對象的引用賦值給一個引用變量，這兩個操作之間不能重排序；

2）初次讀一個包含 final 域的對象的引用，與隨後初次讀這個 final 域，這兩個操作之間不能重排序。

下面通過一些實例性的代碼來分別說明這兩個規則。

public class FinalExample {
    int i; 						// 普通變量
    final int j; 					// final 變量
    
    static FinalExample obj;
    
    public FinalExample() {			        // 構造函數
        i = 1;						// 寫普通域
        j = 2;						// 寫 final 域
    }
    
    public static void writer() {	                // 寫線程 A 執行
        obj = new FinalExample();
    }
    
    public static void reader() {	              // 讀線程B執行
        FinalExample object = obj;	              // 讀對象引用
        int a = object.i;			      // 讀普通域
        int b = object.j;			      // 讀 final 域
    }
}

寫 final 域的重排序規則

寫 final 域的重排序規則禁止把 final 域的寫重排序到構造函數之外。這個規則的實現包含下面兩個方面：

1）JMM 禁止編譯器把 final 域的寫重排序到構造函數之外；

2）編譯器會在 final 域的寫之後，構造函數 return 之前，插入一個 StoreStore 屏障。這個屏障禁止處理器把 final 域的寫重排序到構造函數之外。

現在讓我們分析 writer() 方法。writer() 方法只包含一行代碼：finalExample = new FinalExample( )。這行代碼包含兩個步驟，如下：

1）構造一個 FinalExample 類型的對象；

2）把這個對象的引用賦值給引用變量 obj。

假設線程 B 讀對象引用與讀對象的成員域之間沒有重排序（馬上會說明爲什麼需要這個假設），下圖是一種可能的執行時序。

在上圖中，寫普通域的操作被編譯器重排序到了構造函數之外，讀線程 B 錯誤地讀取了普通變量 i 初始化之前的值。而寫 final 域的操作，被寫 final 域的重排序規則“限定”在了構造函數之內，讀線程 B 正確地讀取了 final 變量初始化之後的值。

寫 final 域的重排序規則可以確保：在對象引用爲任意線程可見之前，對象的 final 域已經被正確初始化過了，而普通域不具有這個保障。以上圖爲例，在讀線程 B “看到” 對象引用 obj 時，很可能 obj 對象還沒有構造完成（對普通域 i 的寫操作被重排序到構造函數外，此時初始值 1 還沒有寫入普通域 i）。

讀 final 域的重排序規則

讀 final 域的重排序規則是，在一個線程中，初次讀對象引用與初次讀該對象包含的 final 域，JMM 禁止處理器重排序這兩個操作（注意，這個規則僅僅針對處理器）。編譯器會在讀 final 域操作的前面插入一個 LoadLoad 屏障。

初次讀對象引用與初次讀該對象包含的 final 域，這兩個操作之間存在間接依賴關係。由於編譯器遵守間接依賴關係，因此編譯器不會重排序這兩個操作。大多數處理器也會遵守間接依賴，也不會重排序這兩個操作。但是有少數處理器允許對存在間接依賴關係的操作做重排序（比如 alpha 處理器），這個規則就是專門用來針對這種處理器的。

read() 方法包含 3 個操作。

初次讀引用變量 obj。
初次讀引用變量 obj 指向對象的普通域 j。
初次讀引用變量 obj 指向對象的 final 域 i。

現在假設寫線程 A 沒有發生任何重排序，同時程序在不遵守間接依賴的處理器上執行，下圖所示是一種可能的執行時序。

在上圖中，讀對象的普通域的操作被處理器重排序到讀對象引用之前。讀普通域時，該域還沒有被寫線程 A 寫入，，這是一個錯誤的讀取操作。而讀 final 域的重排序規則會把讀對象 final 域的操作“限定”在讀對象引用之後，此時該 final 域已經被 A 線程初始化過了，這是一個正確的讀取操作。

讀 final 域的重排序規則可以確保：在讀一個對象的 final 域之前，一定會先讀包含這個 final 域的對象的引用。在這個實例程序中，如果該引用不爲 null，那麼該引用對象的 final 域一定已經被 A 線程初始化過了。

final 域爲引用類型

上面我們看到的 final 域是基礎數據類型，如果 final 域是引用數據類型，將會有什麼效果？請看下面示例代碼。

public class FinalRefrenceExample {
    
    final int[] intArray;						  // final 是引用類型
	static FinalReferencExample obj;
    
    public FinalReferenceExample() {			                  // 構造函數
        intArray = new int[1];					          // 1
        intArray[0] = 1;						  // 2
    }
    
    public static void writeOne() {				          // 寫線程A執行
        obj = new FinalReferenceExample();		                  // 3
    }
    
    public static void writerTwo() {			                  // 寫線程B執行
        obj.intArray[0] = 2;					          // 4
    }
    
    public static void reader() {				         // 讀線程C執行
        if (obj != null) {						 // 5
            int temp1 = obj.intArray[0];		                 // 6
        }
    }
}

本例 final 域爲一個引用類型，它引用一個 int 型的數組對象。對於引用類型，寫 final 域的重排序規則對編譯器和處理器增加了如下約束：在構造函數內對一個 final 引用的對象的成員域的寫入，與隨後在構造函數外把這個被構造對象的引用賦值給一個引用變量，這兩個操作之間不能重排序。

對上面的示例程序，假設首先線程 A 執行 writerOne() 方法，執行完後線程 B 執行 writerTwo() 方法，執行完後線程 C 執行 reader() 方法。下圖是一種可能的線程執行時序。

在上圖中，1是對 final 域的寫入，2 是對這個 final 域引用的對象的成員域的寫入，3是把被構造的對象的引用賦值給某個引用變量。這裏除了前面提到的 1 不能和 3 重排序外，2 和 3 也不能重排序。

JMM 可以確保讀線程 C 至少能看到寫線程 A 在構造函數中對 final 引用對象的成員域的寫入。即 C 至少能看到數組下標 0 的值爲 1。而寫線程 B 對數組元素的寫入，讀線程 C 可能看得到，也可能看不到。JMM 不保證線程 B 的寫入對讀線程 C 可見，因爲寫線程 B 和讀線程 C 之間存在數據競爭，此時的執行結果不可預知。

如果想要確保讀線程 C 看到寫線程 B 對數組元素的寫入，寫線程 B 和讀線程 C 之間需要使用同步原語（lock 或 volatile）來確保內存可見性。

爲什麼 final 引用不能從構造函數中逸出

前面我們提到過，寫 final 域的重排序規則可以確保：在引用變量爲任意線程可見之前，該引用變量指向的對象的 final 域已經在構造函數中被正確初始化過了。其實，要得到這個效果，還需要一個保證：在構造函數內部，不能讓這個被構造函數的引用爲其他線程所見，也就是對象引用不能在構造函數中“逸出”。爲了說明這個問題，讓我們來看下面的示例代碼：

public class FinalReferenceEscapeExample {
    final int i;
    static FinalReferenceEscapeExample obj;
    
    public FinalReferenceEscapeExample() {
        i = 1;								// 1 寫 final 域
        obj = this;							// 2 this 引用在此“逸出”
    }
    
    public static void writer() {
        new FinalReferenceEscapeExample();
    }
    
    public static void reader() {
		if (obj != null) {					// 3
            int temp = obj.i;				                // 4
        }
    }
}

假設一個線程 A 執行 writer() 方法，另一個線程 B 執行 reader() 方法。這裏的操作 2 使得對象還未完成構造前就爲線程 B 可見。即使這裏的操作 2 是構造函數的最後一步，且在程序中操作 2 排在操作 1 後面，執行 read() 方法的線程仍然可能無法看到 final 域被初始化後的值，因爲這裏的操作 1 和操作 2 之間可能被重排序。實際的執行時序可能如下圖所示：

在上圖中：在構造函數返回前，被構造對象的引用不能爲其他線程所見，因爲此時的 final 域可能還沒有被初始化。在構造函數返回後，任意線程都將保證能看到 final 域正確初始化之後的值。

JSR-133 爲什麼要增強 final 語義

在舊的 Java 內存模型中，一個最嚴重的缺陷就是線程可能看到 final 域的值會改變。比如，一個線程當前看到一個整型 final 域的值爲 0（還未初始化之前的默認值），過一段時間之後這個線程再去讀這個 final 域的值時，卻發現值變爲 1（被某個線程初始化之後的值）。最常見的例子就是在舊的 Java 內存模型中，String 的值可能會發生改變。

爲了修補這個漏洞，JSR-133 專家組增強了 final 的語義。通過爲 final 域增加寫和讀重排序規則，可以爲 Java 程序員提供初始化安全保證：只要對象是正確構造的（被構造對象的引用在構造函數中沒有“逸出”），那麼不需要使用同步（指 lock 和 volatile 的使用）就可以保證任意線程都能看到這個 final 域在構造函數中被初始化後的值。

【Java】final 域的內存語義

final 域的重排序規則

寫 final 域的重排序規則

讀 final 域的重排序規則

final 域爲引用類型

爲什麼 final 引用不能從構造函數中逸出

JSR-133 爲什麼要增強 final 語義

【TCP/IP】Nagle 算法以及所謂 TCP 粘包

【Zookeeper】Zookeeper的Leader選舉流程

【Java】聊聊線程池，ThreadPoolExecutor源碼詳解

【Java】Java中的動態代理以及在框架中的應用

【設計模式】併發編程下的單例模式

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結