深入剖析volatile原理

前言

這篇文章，南國對Java併發中的一個重要知識點volatile關鍵字進行重要的剖析，這是繼深入剖析synchronized原理對併發重要的知識點的詳細解析。筆者在寫這篇博客時候許多地方參考了java關鍵字—volatile.md 仔細讀完，獲益匪淺。

1.volatile簡介

volatile是java虛擬機提供的最輕量級的同步機制。但它同時不容易被正確理解，也至於在併發編程中很多程序員遇到線程安全的問題就會使用synchronized。Java內存模型告訴我們，各個線程會將共享變量從主內存中拷貝到工作內存，然後執行引擎會基於工作內存中的數據進行操作處理。線程在工作內存進行操作後何時會寫到主內存中？這個時機對普通變量是沒有規定的，而針對volatile修飾的變量給java虛擬機特殊的約定，線程對volatile變量的修改會立刻被其他線程所感知，即不會出現數據髒讀的現象，從而保證數據的“可見性”。

筆者在之前的博客中講過volatile關鍵字的兩個特性：

保證了不同線程對這個變量進行讀取時的可見性，即一個線程修改了某個變量的值，這新值對其他線程來說是立即可見的。(volatile 解決了線程間共享變量
禁止進行指令重排序，阻止編譯器對代碼的優化

要想併發程序正確地執行，必須要保證原子性、可見性以及有序性，鎖保證了原子性，而volatile保證可見性和有序性。
本文後面主要講volatile的底層是如何實現可見性和有序性的？

2.volatile的實現原理

olatile是怎樣實現了？比如一個很簡單的Java代碼：
private volatile boolean flag = false;

在生成彙編代碼時會在volatile修飾的共享變量進行寫操作的時候會多出Lock前綴的指令（具體的大家可以使用一些工具去看一下，這裏我就只把結果說出來）。我們想這個Lock指令肯定有神奇的地方，那麼Lock前綴的指令在多核處理器下會發現什麼事情了？主要有這兩個方面的影響：

將當前處理器緩存行的數據寫回系統內存；
這個寫回內存的操作會使得其他CPU裏緩存了該內存地址的數據無效

爲了提高處理速度，處理器不直接和內存進行通信，而是先將系統內存的數據讀到內部緩存（L1，L2或其他）後再進行操作，但操作完不知道何時會寫到內存。如果對聲明瞭volatile的變量進行寫操作，JVM就會向處理器發送一條Lock前綴的指令，將這個變量所在緩存行的數據寫回到系統內存。但是，就算寫回到內存，如果其他處理器緩存的值還是舊的，再執行計算操作就會有問題。所以，在多處理器下，爲了保證各個處理器的緩存是一致的，就會實現緩存一致性協議，每個處理器通過嗅探在總線上傳播的數據來檢查自己緩存的值是不是過期了，當處理器發現自己緩存行對應的內存地址被修改，就會將當前處理器的緩存行設置成無效狀態，當處理器對這個數據進行修改操作的時候，會重新從系統內存中把數據讀到處理器緩存裏。因此，經過分析我們可以得出如下結論：

Lock前綴的指令會引起處理器緩存寫回內存；
一個處理器的緩存回寫到內存會導致其他處理器的緩存失效；
當處理器發現本地緩存失效後，就會從內存中重讀該變量數據，即可以獲取當前最新值。

這樣針對volatile變量通過這樣的機制就使得每個線程都能獲得該變量的最新值。

3.volatile的happens-before關係

經過上面的分析，我們已經知道了volatile變量可以通過緩存一致性協議保證每個線程都能獲得最新值，即滿足數據的“可見性”。我一直將併發分析的切入點分爲兩個核心，三大性質。兩大核心：JMM內存模型（主內存和工作內存）以及happens-before；三條性質：原子性，可見性，有序性。廢話不多說，先來看兩個核心之一：volatile的happens-before關係。

在六條happens-before規則中有一條是：**volatile變量規則：對一個volatile域的寫，happens-before於任意後續對這個volatile域的讀。**下面我們結合具體的代碼，我們利用這條規則推導下：

public class VolatileExample {
    private int a = 0;
    private volatile boolean flag = false;
    public void writer(){
        a = 1;          //1
        flag = true;   //2
    }
    public void reader(){
        if(flag){      //3
            int i = a; //4
        }
    }
}

上面的實例代碼對應的happens-before關係如下圖所示：

加鎖線程A先執行writer方法，然後線程B執行reader方法。圖中每一個箭頭兩個節點就代碼一個happens-before關係，黑色的代表根據程序順序規則推導出來，紅色的是根據volatile變量的寫happens-before 於任意後續對volatile變量的讀，而藍色的就是根據傳遞性規則推導出來的。這裏的2 happen-before 3，同樣根據happens-before規則定義：如果A happens-before B,則A的執行結果對B可見，並且A的執行順序先於B的執行順序，我們可以知道操作2執行結果對操作3來說是可見的，也就是說當線程A將volatile變量 flag更改爲true後線程B就能夠迅速感知。

4. volatile的內存語義

還是按照兩個核心的分析方式，分析完happens-before關係後我們現在就來進一步分析volatile的內存語義。還是以上面的代碼爲例，假設線程A先執行writer方法，線程B隨後執行reader方法，初始時線程的本地內存中flag和a都是初始狀態，下圖是線程A執行volatile寫後的狀態圖。

當volatile變量寫後，線程中本地內存中共享變量就會置爲失效的狀態，因此線程B再需要讀取從主內存中去讀取該變量的最新值。下圖就展示了線程B讀取同一個volatile變量的內存變化示意圖。

從橫向來看，線程A和線程B之間進行了一次通信，線程A在寫volatile變量時，實際上就像是給B發送了一個消息告訴線程B你現在的值都是舊的了，然後線程B讀這個volatile變量時就像是接收了線程A剛剛發送的消息。既然是舊的了，那線程B該怎麼辦了？自然而然就只能去主內存去取啦。