[學習筆記-Java併發源碼-2] volatile的實現原理

　
volatile這個關鍵字可能很多朋友都聽說過，或許也都用過。在Java 5之前，它是一個備受爭議的關鍵字，因爲在程序中使用它往往會導致出人意料的結果。在Java 5之後，volatile關鍵字才得以重獲生機。

volatile關鍵字雖然從字面上理解起來比較簡單，但是要用好不是一件容易的事情。由於volatile關鍵字是與Java的內存模型有關的，因此在講述volatile關鍵之前，我們先來了解一下與內存模型相關的概念和知識，然後分析了volatile關鍵字的實現原理，最後給出了幾個使用volatile關鍵字的場景。

目錄大綱：

內存模型的相關概念
併發編程中的三個概念
Java內存模型
深入剖析volatile關鍵字
使用volatile關鍵字的場景

內存模型的相關概念

大家都知道，計算機在執行程序時，每條指令都是在CPU中執行的，而執行指令過程中，勢必涉及到數據的讀取和寫入。由於程序運行過程中的臨時數據是存放在主存（物理內存）當中的，這時就存在一個問題，由於CPU執行速度很快，而從內存讀取數據和向內存寫入數據的過程跟CPU執行指令的速度比起來要慢的多，因此如果任何時候對數據的操作都要通過和內存的交互來進行，會大大降低指令執行的速度。因此在CPU裏面就有了高速緩存。

也就是，當程序在運行過程中，會將運算需要的數據從主存複製一份到CPU的高速緩存當中，那麼CPU進行計算時就可以直接從它的高速緩存讀取數據和向其中寫入數據，當運算結束之後，再將高速緩存中的數據刷新到主存當中。舉個簡單的例子，比如下面的這段代碼：

i = i + 1;

當線程執行這個語句時，會先從主存當中讀取i的值，然後複製一份到高速緩存當中，然後CPU執行指令對i進行加1操作，然後將數據寫入高速緩存，最後將高速緩存中i最新的值刷新到主存當中。

這個代碼在單線程中運行是沒有任何問題的，但是在多線程中運行就會有問題了。在多核CPU中，每條線程可能運行於不同的CPU中，因此每個線程運行時有自己的高速緩存（對單核CPU來說，其實也會出現這種問題，只不過是以線程調度的形式來分別執行的）。本文我們以多核CPU爲例。

　　比如同時有2個線程執行這段代碼，假如初始時i的值爲0，那麼我們希望兩個線程執行完之後i的值變爲2。但是可能存在下面一種情況：初始時，兩個線程分別讀取i的值存入各自所在的CPU的高速緩存當中，然後線程1進行加1操作，然後把i的最新值1寫入到內存。此時線程2的高速緩存當中i的值還是0，進行加1操作之後，i的值爲1，然後線程2把i的值寫入內存。

最終結果i的值是1，而不是2。
這就是著名的緩存一致性問題。通常稱這種被多個線程訪問的變量爲共享變量。

也就是說，如果一個變量在多個CPU中都存在緩存（一般在多線程編程時纔會出現），那麼就可能存在緩存不一致的問題。

爲了解決緩存不一致性問題，通常來說有以下2種解決方法：

通過在總線加LOCK#鎖的方式
通過緩存一致性協議

這2種方式都是硬件層面上提供的方式。

在早期的CPU當中，是通過在總線上加LOCK#鎖的形式來解決緩存不一致的問題。因爲CPU和其他部件進行通信都是通過總線來進行的，如果對總線加LOCK#鎖的話，也就是說阻塞了其他CPU對其他部件訪問（如內存），從而使得只能有一個CPU能使用這個變量的內存。比如上面例子中如果一個線程在執行 i = i +1，如果在執行這段代碼的過程中，在總線上發出了LCOK#鎖的信號，那麼只有等待這段代碼完全執行完畢之後，其他CPU才能從變量i所在的內存讀取變量，然後進行相應的操作。這樣就解決了緩存不一致的問題。

很明顯，由於在鎖住總線期間，其他CPU無法訪問內存，導致效率低下。

所以就出現了緩存一致性協議。

最出名的就是Intel的MESI協議，MESI協議保證了每個緩存中使用的共享變量的副本是一致的。它核心的思想是：當CPU寫數據時，如果發現操作的變量是共享變量，即在其他CPU中也存在該變量的副本，會發出信號通知其他CPU將該變量的緩存行置爲無效狀態，因此當其他CPU需要讀取這個變量時，發現自己緩存中緩存該變量的緩存行是無效的，那麼它就會從內存重新讀取。

併發編程中的三個概念

在併發編程中，我們通常會遇到以下三個問題：

原子性問題，可見性問題，有序性問題

我們先看具體看一下這三個概念：

原子性

即一個操作或者多個操作要麼全部執行並且執行的過程不會被任何因素打斷，要麼就都不執行。

一個很經典的例子就是銀行賬戶轉賬問題：轉賬的2個操作必須要具備原子性才能保證不出現一些意外的問題。

可見性

可見性是指當多個線程訪問同一個變量時，一個線程修改了這個變量的值，其他線程能夠立即看得到修改的值。

舉個簡單的例子，看下面這段代碼：

//線程1執行的代碼
int i = 0;
i = 10;
 
//線程2執行的代碼
j = i;

假若執行線程1的是CPU1，執行線程2的是CPU2。由上面的分析可知，當線程1執行 i =10這句時，會先把i的初始值加載到CPU1的高速緩存中，然後賦值爲10，那麼在CPU1的高速緩存當中i的值變爲10了，卻沒有立即寫入到主存當中。

此時線程2執行 j = i，它會先去主存讀取i的值並加載到CPU2的緩存當中，注意此時內存當中i的值還是0，那麼就會使得j的值爲0，而不是10.

這就是可見性問題，線程1對變量i修改了之後，線程2沒有立即看到線程1修改的值。

有序性

即程序執行的順序按照代碼的先後順序執行。舉個簡單的例子，看下面這段代碼：

int i = 0;              
boolean flag = false;
i = 1;                //語句1  
flag = true;          //語句2

上面代碼定義了一個int型變量，定義了一個boolean類型變量，然後分別對兩個變量進行賦值操作。從代碼順序上看，語句1是在語句2前面的，那麼JVM在真正執行這段代碼的時候會保證語句1一定會在語句2前面執行嗎？不一定，爲什麼呢？這裏可能會發生指令重排序（Instruction Reorder）。

指令重排序: 一般來說，處理器爲了提高程序運行效率，可能會對輸入代碼進行優化，它不保證程序中各個語句的執行先後順序同代碼中的順序一致，但是它會保證程序最終執行結果和代碼順序執行的結果是一致的。

比如上面的代碼中，語句1和語句2誰先執行對最終的程序結果並沒有影響，那麼就有可能在執行過程中，語句2先執行而語句1後執行。

但是要注意，雖然處理器會對指令進行重排序，但是它會保證程序最終結果會和代碼順序執行結果相同，那麼它靠什麼保證的呢？再看下面一個例子：

int a = 10;    //語句1
int r = 2;    //語句2
a = a + 3;    //語句3
r = a*a;     //語句4

這段代碼有4個語句，那麼可能的一個執行順序是：

語句2 -> 語句1 -> 語句3 -> 語句4

那麼可不可能是這個執行順序呢：語句2 -> 語句1 -> 語句4 -> 語句3

不可能，因爲處理器在進行重排序時是會考慮指令之間的數據依賴性，如果一個指令Instruction 2必須用到Instruction 1的結果，那麼處理器會保證Instruction 1會在Instruction 2之前執行。

上面其實就是單線程考慮的問題了，如果把指令重排序放到多線程的情況下來看沒有這麼簡單了。
下面看一個例子：

//線程1:
context = loadContext();   //語句1
inited = true;             //語句2
 
//線程2:
while(!inited ){
  sleep()
}
doSomethingwithconfig(context);

上面代碼中，由於語句1和語句2沒有數據依賴性，因此可能會被重排序。

假如發生了重排序，在線程1執行過程中先執行語句2，而此是線程2會以爲初始化工作已經完成，那麼就會跳出while循環，去執行doSomethingwithconfig(context)方法，而此時context並沒有被初始化，就會導致程序出錯。

從上面的分析中可以看出，指令重排序不會影響單個線程的執行，但是會影響到線程併發執行的正確性。

小結

也就是說，要想併發程序正確地執行，必須要保證原子性、可見性以及有序性。只要有一個沒有被保證，就有可能會導致程序運行不正確。

Java內存模型

在前面談到了一些關於內存模型以及併發編程中可能會出現的一些問題。下面我們來看一下Java是如何解決上面分析的三大併發問題的。Java爲了保證我們在併發編程時保證程序的執行準確性，約定了Java內存模型。

在Java虛擬機規範中試圖定義一種Java內存模型（Java Memory Model，JMM）來屏蔽各個硬件平臺和操作系統的內存訪問差異，以實現讓Java程序在各種平臺下都能達到一致的內存訪問效果。

Java內存模型規定了哪些東西呢，它定義了程序中變量的訪問規則，往大一點說是定義了程序執行的次序。注意，爲了獲得較好的執行性能，Java內存模型並沒有限制執行引擎使用處理器的寄存器或者高速緩存來提升指令執行速度，也沒有限制編譯器對指令進行重排序。也就是說，在java內存模型中，也會存在緩存一致性問題和指令重排序的問題。

Java內存模型規定所有的變量都是存在主存當中（類似於前面說的物理內存），每個線程都有自己的工作內存（類似於前面的高速緩存）。線程對變量的所有操作都必須在工作內存中進行，而不能直接對主存進行操作。並且每個線程不能訪問其他線程的工作內存。

舉個簡單的例子：在java中，執行下面這個語句：

i  = 10;

執行線程必須先在自己的工作線程中對變量i所在的緩存行進行賦值操作，然後再寫入主存當中。而不是直接將數值10寫入主存當中。

那麼Java語言本身對原子性、可見性以及有序性提供了哪些保證呢？

原子性

在Java中，對基本數據類型的變量的讀取和賦值操作是原子性操作，即這些操作是不可被中斷的，要麼執行，要麼不執行。

請分析以下哪些操作是原子性操作：

x = 10;         //語句1
y = x;         //語句2
x++;           //語句3
x = x + 1;     //語句4

其實只有語句1是原子性操作，其他三個語句都不是原子性操作。

語句1是直接將數值10賦值給x，也就是說線程執行這個語句的會直接將數值10寫入到工作內存中。

語句2實際上包含2個操作，它先要去讀取x的值，再將x的值寫入工作內存，雖然讀取x的值以及將x的值寫入工作內存這2個操作都是原子性操作，但是合起來就不是原子性操作了。

同樣的，x++和 x = x+1包括3個操作：讀取x的值，進行加1操作，寫入新的值。

也就是說，只有簡單的讀取、賦值（而且必須是將數字賦值給某個變量，變量之間的相互賦值不是原子操作）纔是原子操作。

從上面可以看出，Java內存模型只保證了基本讀取和賦值是原子性操作，如果要實現更大範圍操作的原子性，可以通過synchronized和Lock來實現。由於synchronized和Lock能夠保證任一時刻只有一個線程執行該代碼塊，那麼自然就不存在原子性問題了，從而保證了原子性。

可見性

對於可見性，Java提供了volatile關鍵字來保證可見性。

當一個共享變量被volatile修飾時，它會保證修改的值會立即被更新到主存，當有其他線程需要讀取時，它會去內存中讀取新值。

而普通的共享變量不能保證可見性，因爲普通共享變量被修改之後，什麼時候被寫入主存是不確定的，當其他線程去讀取時，此時內存中可能還是原來的舊值，因此無法保證可見性。

另外，通過synchronized和Lock也能夠保證可見性，synchronized和Lock能保證同一時刻只有一個線程獲取鎖然後執行同步代碼，並且在釋放鎖之前會將對變量的修改刷新到主存當中。因此可以保證可見性。

有序性

在Java內存模型中，允許編譯器和處理器對指令進行重排序，但是重排序過程不會影響到單線程程序的執行，卻會影響到多線程併發執行的正確性。

在Java裏面，可以通過volatile關鍵字來保證一定的“有序性”。另外可以通過synchronized和Lock來保證有序性，很顯然，synchronized和Lock保證每個時刻是有一個線程執行同步代碼，相當於是讓線程順序執行同步代碼，自然就保證了有序性。

另外，Java內存模型具備一些先天的“有序性”，即不需要通過任何手段就能夠得到保證的有序性，這個通常也稱爲happens-before 原則在JVM中默默實現保證的。如果兩個操作的執行次序無法從happens-before原則推導出來，那麼它們就不能保證它們的有序性，虛擬機可以隨意地對它們進行重排序。
（具體happens-before原則請自行查詢）

深入剖析volatile關鍵字

volatile關鍵字的兩層語義

一旦一個共享變量（類的成員變量、類的靜態成員變量）被volatile修飾之後，那麼就具備了兩層語義：

保證了不同線程對這個變量進行操作時的可見性，即一個線程修改了某個變量的值，這新值對其他線程來說是立即可見的。
禁止進行指令重排序。

先看一段代碼，假如線程1先執行，線程2後執行：

//線程1
boolean stop = false;
while(!stop){
    doSomething();
}
 
//線程2
stop = true;

這段代碼是很典型的一段代碼，很多人在中斷線程時可能都會採用這種標記辦法。但是事實上，這段代碼會完全運行正確麼？不一定會將線程中斷。

在前面已經解釋過，每個線程在運行過程中都有自己的工作內存，那麼線程1在運行的時候，會將stop變量的值拷貝一份放在自己的工作內存當中。那麼當線程2更改了stop變量的值之後，但是還沒來得及寫入主存當中，線程2轉去做其他事情了，那麼線程1由於不知道線程2對stop變量的更改，因此還會一直循環下去。

但是用volatile修飾之後就變得不一樣了：

使用volatile關鍵字會強制將修改的值立即寫入主存；
使用volatile關鍵字的話，當線程2進行修改時，會導致線程1的工作內存中緩存變量stop的緩存行無效（反映到硬件層的話，就是CPU的L1或者L2緩存中對應的緩存行無效）；
由於線程1的工作內存中緩存變量stop的緩存行無效，所以線程1再次讀取變量stop的值時會去主存讀取。

那麼在線程2修改stop值時（當然這裏包括2個操作，修改線程2工作內存中的值，然後將修改後的值寫入內存），會使得線程1的工作內存中緩存變量stop的緩存行無效，然後線程1讀取時，發現自己的緩存行無效，它會等待緩存行對應的主存地址被更新之後，然後去對應的主存讀取最新的值。

那麼線程1讀取到的就是最新的正確的值。

volatile的原子性

從上面知道volatile關鍵字保證了操作的可見性，但是volatile能保證對變量的操作是原子性嗎？

下面看一個例子：

public class Test {
    public volatile int inc = 0;
     
    public void increase() {
        inc++;
    }
     
    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }
         
        while(Thread.activeCount()>1)  //保證前面的線程都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

也許有些朋友認爲是10000。但是事實上運行它會發現每次運行結果都不一致，都是一個小於10000的數字。

或許有人會認爲上面是對變量inc進行自增操作，由於volatile保證了可見性，那麼在每個線程中對inc自增完之後，在其他線程中都能看到修改後的值啊，所以有10個線程分別進行了1000次操作，那麼最終inc的值應該是1000*10=10000。

這裏面就有一個誤區了，volatile關鍵字能保證可見性沒有錯，但是上面的程序錯在沒能保證原子性。可見性只能保證每次讀取的是最新的值，但是volatile沒辦法保證對變量的操作的原子性。

在前面已經提到過，自增操作是不具備原子性的，它包括讀取變量的原始值、進行加1操作、寫入工作內存。那麼就是說自增操作的三個子操作可能會分割開執行，就有可能導致下面這種情況出現：

假如某個時刻變量inc的值爲10，
線程1對變量進行自增操作，線程1先讀取了變量inc的原始值，然後線程1被阻塞了；
然後線程2對變量進行自增操作，線程2也去讀取變量inc的原始值，由於線程1只是對變量inc進行讀取操作，而沒有對變量進行修改操作，所以不會導致線程2的工作內存中緩存變量inc的緩存行無效，所以線程2會直接去主存讀取inc的值，發現inc的值時10，然後進行加1操作，並把11寫入工作內存，最後寫入主存。
然後線程1接着進行加1操作，由於已經讀取了inc的值，注意此時在線程1的工作內存中inc的值仍然爲10，所以線程1對inc進行加1操作後inc的值爲11，然後將11寫入工作內存，最後寫入主存。
那麼兩個線程分別進行了一次自增操作後，inc只增加了1。

根源就在這裏，自增操作不是原子性操作，而且volatile也無法保證對變量的任何操作都是原子性的。

把上面的代碼改成以下任何一種都可以達到效果：

public class Test {
    public  int inc = 0;
    
    public synchronized void increase() {
        inc++;
    }
    
    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }
        
        while(Thread.activeCount()>1)  //保證前面的線程都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

採用AtomicInteger：

public class Test {
    public  AtomicInteger inc = new AtomicInteger();
     
    public  void increase() {
        inc.getAndIncrement();
    }
    
    public static void main(String[] args) {
        final Test test = new Test();
        for(int i=0;i<10;i++){
            new Thread(){
                public void run() {
                    for(int j=0;j<1000;j++)
                        test.increase();
                };
            }.start();
        }
        
        while(Thread.activeCount()>1)  //保證前面的線程都執行完
            Thread.yield();
        System.out.println(test.inc);
    }
}

在java 1.5的java.util.concurrent.atomic包下提供了一些原子操作類，即對基本數據類型的自增（加1操作），自減（減1操作）、以及加法操作（加一個數），減法操作（減一個數）進行了封裝，保證這些操作是原子性操作。atomic是利用CAS來實現原子性操作的（Compare And Swap），CAS實際上是利用處理器提供的CMPXCHG指令實現的，而處理器執行CMPXCHG指令是一個原子性操作。

volatile的有序性

在前面提到volatile關鍵字能禁止指令重排序，所以volatile能在一定程度上保證有序性。

volatile關鍵字禁止指令重排序有兩層意思：

當程序執行到volatile變量的讀操作或者寫操作時，在其前面的操作的更改肯定全部已經進行，且結果已經對後面的操作可見；在其後面的操作肯定還沒有進行；
在進行指令優化時，不能將在對volatile變量訪問的語句放在其後面執行，也不能把volatile變量後面的語句放到其前面執行。

//x、y爲非volatile變量
//flag爲volatile變量
 
x = 2;        //語句1
y = 0;        //語句2
flag = true;  //語句3
x = 4;         //語句4
y = -1;       //語句5

由於flag變量爲volatile變量，那麼在進行指令重排序的過程的時候，不會將語句3放到語句1、語句2前面，也不會講語句3放到語句4、語句5後面。但是要注意語句1和語句2的順序、語句4和語句5的順序是不作任何保證的。

並且volatile關鍵字能保證，執行到語句3時，語句1和語句2必定是執行完畢了的，且語句1和語句2的執行結果對語句3、語句4、語句5是可見的。

那麼我們回到前面舉的一個例子：

//線程1:
context = loadContext();   //語句1
inited = true;             //語句2
 
//線程2:
while(!inited ){
  sleep()
}
doSomethingwithconfig(context);

這裏如果用volatile關鍵字對inited變量進行修飾，就不會再出現問題了，因爲當執行到語句2時，必定能保證context已經初始化完畢。

volatile的原理和實現機制

前面講述了源於volatile關鍵字的一些使用，下面我們來探討一下volatile到底如何保證可見性和禁止指令重排序的。

下面這段話摘自《深入理解Java虛擬機》：

觀察加入volatile關鍵字和沒有加入volatile關鍵字時所生成的彙編代碼發現，加入volatile關鍵字時，會多出一個lock前綴指令

lock前綴指令實際上相當於一個內存屏障（也成內存柵欄），內存屏障會提供3個功能：

它確保指令重排序時不會把其後面的指令排到內存屏障之前的位置，也不會把前面的指令排到內存屏障的後面；即在執行到內存屏障這句指令時，在它前面的操作已經全部完成；
它會強制將對緩存的修改操作立即寫入主存；
如果是寫操作，它會導致其他CPU中對應的緩存行無效。

使用volatile關鍵字的場景　

synchronized關鍵字是防止多個線程同時執行一段代碼，那麼就會很影響程序執行效率，而volatile關鍵字在某些情況下性能要優於synchronized，但是要注意volatile關鍵字是無法替代synchronized關鍵字的，因爲volatile關鍵字無法保證操作的原子性。通常來說，使用volatile必須具備以下2個條件：

對變量的寫操作不依賴於當前值
該變量沒有包含在具有其他變量的不變式中

實際上，這些條件表明，可以被寫入 volatile 變量的這些有效值獨立於任何程序的狀態，包括變量的當前狀態。
事實上，我的理解就是上面的2個條件需要保證操作是原子性操作，才能保證使用volatile關鍵字的程序在併發時能夠正確執行。

下面列舉幾個Java中使用volatile的幾個場景。

狀態標記量

volatile boolean flag = false;
 
while(!flag){
    doSomething();
}
 
public void setFlag() {
    flag = true;
}


volatile boolean inited = false;
//線程1:
context = loadContext();  
inited = true;            
 
//線程2:
while(!inited ){
sleep()
}
doSomethingwithconfig(context);

double check

class Singleton{
    private volatile static Singleton instance = null;
     
    private Singleton() {
         
    }
     
    public static Singleton getInstance() {
        if(instance==null) {
            synchronized (Singleton.class) {
                if(instance==null)
                    instance = new Singleton();
            }
        }
        return instance;
    }
}

參考資料：
《Java編程思想》
《深入理解Java虛擬機》

[學習筆記-Java併發源碼-2] volatile的實現原理

目錄大綱：

內存模型的相關概念

併發編程中的三個概念

原子性

可見性

有序性

小結

Java內存模型

原子性

可見性

有序性

深入剖析volatile關鍵字

volatile關鍵字的兩層語義

volatile的原子性

volatile的有序性

volatile的原理和實現機制

使用volatile關鍵字的場景

狀態標記量

double check

[學習筆記-Java併發源碼-2] volatile的實現原理

[學習筆記-Java併發源碼-1] synchronized的實現原理

[學習筆記-Java併發源碼] 目錄

[學習筆記-Java集合-17] Queue - DelayQueue源碼分析

[學習筆記-Java集合-16] Queue - LinkedBlockingQueue源碼分析

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結