Volatile原理分析

1、引言

在多線程併發編程中synchronized和Volatile都扮演着重要的角色，Volatile是輕量級的synchronized，它在多處理器開發中保證了共享變量的“可見性”。可見性的意思是當一個線程修改一個共享變量時，另外一個線程能讀到這個修改的值。它在某些情況下比synchronized的開銷更小，下面我們將深入分析Voliate的實現原理。

2、Volatile定義

java編程語言允許線程訪問共享變量，爲了確保共享變量能被準確和一致的更新，線程應該確保通過排他鎖單獨獲得這個變量。Java語言提供了volatile，在某些情況下比鎖更加方便。如果一個字段被聲明成volatile，java線程內存模型確保所有線程看到這個變量的值是一致的。volatile可以保證線程可見性且提供了一定的有序性，但是無法保證原子性。在JVM底層volatile是採用“內存屏障”來實現的。

即一旦一個共享變量（類的成員變量、類的靜態成員變量）被volatile修飾之後，那麼就具備了兩層語義：

（1）保證了不同線程對這個變量進行操作時的可見性，即一個線程修改了某個變量的值，這新值對其他線程來說是立即可見的。保證可見性、不保證原子性。
（2）禁止進行指令重排序。

關於這兩層語義的詳細情況，如果不是很理解，可以看博文：併發編程——原子性，可見性和有序性

3、爲什麼要使用Volatile

Volatile變量修飾符如果使用恰當的話，它比synchronized的使用和執行成本會更低，因爲它不會引起線程上下文的切換和調度。

4、Voliate保證可見性

先看一段代碼，假如線程1先執行，線程2後執行：

//線程1
boolean stop = false;
while(!stop){
doSomething();
}

//線程2
stop = true;

這段代碼是很典型的一段代碼，很多人在中斷線程時可能都會採用這種標記辦法。但是事實上，這段代碼會完全運行正確麼？即一定會將線程中斷麼？不一定，也許在大多數時候，這個代碼能夠把線程中斷，但是也有可能會導致無法中斷線程（雖然這個可能性很小，但是隻要一旦發生這種情況就會造成死循環了）。下面解釋一下這段代碼爲何有可能導致無法中斷線程。

前面文章 Java內存模型中我們說過，每個線程在運行過程中都有自己的工作內存，那麼線程1在運行的時候，會將stop變量的值拷貝一份放在自己的工作內存當中。那麼當線程2更改了stop變量的值之後，但是還沒來得及寫入主存當中，線程2轉去做其他事情了，那麼線程1由於不知道線程2對stop變量的更改，因此還會一直循環下去。

但是用volatile修飾之後就變得不一樣了：

　　第一：使用volatile關鍵字會強制將修改的值立即寫入主存；

　　第二：使用volatile關鍵字的話，當線程2進行修改時，會導致線程1的工作內存中緩存變量stop的緩存行無效（反映到硬件層的話，就是CPU的L1或者L2緩存中對應的緩存行無效）；

　　第三：由於線程1的工作內存中緩存變量stop的緩存行無效，所以線程1再次讀取變量stop的值時會去主存讀取。

那麼在線程2修改stop值時（當然這裏包括2個操作，修改線程2工作內存中的值，然後將修改後的值寫入內存），會使得線程1的工作內存中緩存變量stop的緩存行無效，然後線程1讀取時，發現自己的緩存行無效，它會等待緩存行對應的主存地址被更新之後，然後去對應的主存讀取最新的值。那麼線程1讀取到的就是最新的正確的值。

5、volatile不能保證原子性

Volatile不保證對變量的操作是原子性，下面看一個例子：

public class Test {
public volatile int inc = 0;

public void increase() {
    inc++;
}

public static void main(String[] args) {
    final Test test = new Test();
    for(int i=0;i<10;i++){
        new Thread(){
            public void run() {
                for(int j=0;j<1000;j++)
                    test.increase();
            };
        }.start();
    }

    while(Thread.activeCount()>1)  //保證前面的線程都執行完
        Thread.yield();
    System.out.println(test.inc);
}

}

上面程序的輸出有人認爲是10000。但是事實上運行它會發現每次運行結果都不一致，都是一個小於10000的數字。可能有人就會有疑問，不對啊，上面是對變量inc進行自增操作，由於volatile保證了可見性，那麼在每個線程中對inc自增完之後，在其他線程中都能看到修改後的值啊，所以有10個線程分別進行了1000次操作，那麼最終inc的值應該是1000*10=10000。

這裏面就有一個誤區了，volatile關鍵字能保證可見性沒有錯，但是上面的程序錯在沒能保證原子性。可見性只能保證每次讀取的是最新的值，但是volatile沒辦法保證對變量的操作的原子性。在前面已經提到過，自增操作是不具備原子性的，它包括讀取變量的原始值、進行加1操作、寫入工作內存。那麼就是說自增操作的三個子操作可能會分割開執行，就有可能導致下面這種情況出現：

（1）假如某個時刻變量inc的值爲10，線程1對變量進行自增操作，線程1先讀取了變量inc的原始值，然後線程1被阻塞了；

（2）然後線程2對變量進行自增操作，線程2也去讀取變量inc的原始值，由於線程1只是對變量inc進行讀取操作，而沒有對變量進行修改操作，所以不會導致線程2的工作內存中緩存變量inc的緩存行無效，所以線程2會直接去主存讀取inc的值，發現inc的值時10，然後進行加1操作，並把11寫入工作內存，最後寫入主存。

（3）然後線程1接着進行加1操作，由於已經讀取了inc的值，注意此時在線程1的工作內存中inc的值仍然爲10，所以線程1對inc進行加1操作後inc的值爲11，然後將11寫入工作內存，最後寫入主存。

（4）那麼兩個線程分別進行了一次自增操作後，inc只增加了1。

解釋到這裏，可能有朋友會有疑問，不對啊，前面不是保證一個變量在修改volatile變量時，會讓緩存行無效嗎？然後其他線程去讀就會讀到新的值，對，這個沒錯。這個就是上面的happens-before規則中的volatile變量規則，但是要注意，線程1對變量進行讀取操作之後，被阻塞了的話，並沒有對inc值進行修改。然後雖然volatile能保證線程2對變量inc的值讀取是從內存中讀取的，但是線程1沒有進行修改，所以線程2根本就不會看到修改的值。

根源就在這裏，自增操作不是原子性操作，而且volatile也無法保證對變量的任何操作都是原子性的。把上面的代碼改成以下任何一種都可以達到效果：

5.1 採用synchronized

public class Test {
public  int inc = 0;

public synchronized void increase() {
    inc++;
}

public static void main(String[] args) {
    final Test test = new Test();
    for(int i=0;i<10;i++){
        new Thread(){
            public void run() {
                for(int j=0;j<1000;j++)
                    test.increase();
            };
        }.start();
    }

    while(Thread.activeCount()>1)  //保證前面的線程都執行完
        Thread.yield();
    System.out.println(test.inc);
}

}

5.2 採用Lock

public class Test {
public  int inc = 0;
Lock lock = new ReentrantLock();

public  void increase() {
    lock.lock();
    try {
        inc++;
    } finally{
        lock.unlock();
    }
}

public static void main(String[] args) {
    final Test test = new Test();
    for(int i=0;i<10;i++){
        new Thread(){
            public void run() {
                for(int j=0;j<1000;j++)
                    test.increase();
            };
        }.start();
    }

    while(Thread.activeCount()>1)  //保證前面的線程都執行完
        Thread.yield();
    System.out.println(test.inc);
}

}

5.3 採用AtomicInteger

public class Test {
public  AtomicInteger inc = new AtomicInteger();

public  void increase() {
    inc.getAndIncrement();
}

public static void main(String[] args) {
    final Test test = new Test();
    for(int i=0;i<10;i++){
        new Thread(){
            public void run() {
                for(int j=0;j<1000;j++)
                    test.increase();
            };
        }.start();
    }

    while(Thread.activeCount()>1)  //保證前面的線程都執行完
        Thread.yield();
    System.out.println(test.inc);
}

}

在java 1.5的java.util.concurrent.atomic包下提供了一些原子操作類，即對基本數據類型的自增（加1操作），自減（減1操作）、以及加法操作（加一個數），減法操作（減一個數）進行了封裝，保證這些操作是原子性操作。

6、volatile一定程度保證有序性

在前面提到volatile關鍵字能禁止指令重排序，所以volatile能在一定程度上保證有序性。volatile關鍵字禁止指令重排序有兩層意思：

（1）當程序執行到volatile變量的讀操作或者寫操作時，在其前面的操作的更改肯定全部已經進行，且結果已經對後面的操作可見；在其後面的操作肯定還沒有進行；

（2）在進行指令優化時，不能將在對volatile變量訪問的語句放在其後面執行，也不能把volatile變量後面的語句放到其前面執行。

可能上面說的比較繞，舉個簡單的例子：

//x、y爲非volatile變量
//flag爲volatile變量

x = 2;        //語句1
y = 0;        //語句2
flag = true;  //語句3
x = 4;         //語句4
y = -1;       //語句5

由於flag變量爲volatile變量，那麼在進行指令重排序的過程的時候，不會將語句3放到語句1、語句2前面，也不會講語句3放到語句4、語句5後面。但是要注意語句1和語句2的順序、語句4和語句5的順序是不作任何保證的。並且volatile關鍵字能保證，執行到語句3時，語句1和語句2必定是執行完畢了的，且語句1和語句2的執行結果對語句3、語句4、語句5是可見的。那麼我們回到前面舉的一個例子：

//線程1:
context = loadContext();   //語句1
inited = true;             //語句2

//線程2:
while(!inited ){
  sleep()
}
doSomethingwithconfig(context);

前面舉這個例子的時候，提到有可能語句2會在語句1之前執行，那麼就可能導致context還沒被初始化，而線程2中就使用未初始化的context去進行操作，導致程序出錯。這裏如果用volatile關鍵字對inited變量進行修飾，就不會出現這種問題了，因爲當執行到語句2時，必定能保證context已經初始化完畢。

7、volatile的實現機制和原理

7.1 實現機制

前面講述了源於volatile關鍵字的一些使用，下面我們來探討一下volatile到底如何保證可見性和禁止指令重排序的。在x86處理器下通過工具獲取JIT編譯器生成的彙編指令來看看對Volatile進行寫操作CPU會做什麼事情。

Java代碼: instance = new Singleton();//instance是volatile變量
彙編代碼: 0x01a3de1d: movb 0x0,0x1104800( 0x0,(%esp);

觀察加入volatile關鍵字和沒有加入volatile關鍵字時所生成的彙編代碼發現，加入volatile關鍵字時，會多出一個lock前綴指令。lock前綴指令實際上相當於一個內存屏障（也成內存柵欄），內存屏障會提供3個功能：

（1）它確保指令重排序時不會把其後面的指令排到內存屏障之前的位置，也不會把前面的指令排到內存屏障的後面；即在執行到內存屏障這句指令時，在它前面的操作已經全部完成；

（2）它會強制將對緩存的修改操作立即寫入主內存；

（3）如果是寫操作，它會導致其他CPU中對應的緩存行無效。

7.2 實現原理

7.2.1 可見性

處理器爲了提高處理速度，不直接和內存進行通訊，而是將系統內存的數據獨到內部緩存後再進行操作，但操作完後不知什麼時候會寫到內存。

如果對聲明瞭volatile變量進行寫操作時，JVM會向處理器發送一條Lock前綴的指令，將這個變量所在緩存行的數據寫會到系統內存。這一步確保瞭如果有其他線程對聲明瞭volatile變量進行修改，則立即更新主內存中數據。

但這時候其他處理器的緩存還是舊的，所以在多處理器環境下，爲了保證各個處理器緩存一致，每個處理會通過嗅探在總線上傳播的數據來檢查自己的緩存是否過期，當處理器發現自己緩存行對應的內存地址被修改了，就會將當前處理器的緩存行設置成無效狀態，當處理器要對這個數據進行修改操作時，會強制重新從系統內存把數據讀到處理器緩存裏。這一步確保了其他線程獲得的聲明瞭volatile變量都是從主內存中獲取最新的。

7.2.2 有序性

Lock前綴指令實際上相當於一個內存屏障（也成內存柵欄），它確保指令重排序時不會把其後面的指令排到內存屏障之前的位置，也不會把前面的指令排到內存屏障的後面；即在執行到內存屏障這句指令時，在它前面的操作已經全部完成。

8、使用volatile關鍵字的場景

synchronized關鍵字是防止多個線程同時執行一段代碼，那麼就會很影響程序執行效率，而volatile關鍵字在某些情況下性能要優於synchronized，但是要注意volatile關鍵字是無法替代synchronized關鍵字的，因爲volatile關鍵字無法保證操作的原子性。通常來說，使用volatile必須具備以下2個條件：

（1）對變量的寫操作不依賴於當前值
（2）該變量沒有包含在具有其他變量的不變式中

實際上，這些條件表明，可以被寫入volatile變量的這些有效值獨立於任何程序的狀態，包括變量的當前狀態。即實際就是上面的2個條件需要保證操作是原子性操作，才能保證使用volatile關鍵字的程序在併發時能夠正確執行。下面列舉Java中使用volatile的幾個場景。

8.1 狀態標記量

volatile boolean inited = false;
//線程1:
context = loadContext();  
inited = true;            

//線程2:
while(!inited ){
    sleep();
}
doSomethingwithconfig(context);

8.2 double check（單例模式）

class Singleton{
    private volatile static Singleton instance = null;

    private Singleton() {

    }

    public static Singleton getInstance() {
        if(instance == null) {
            synchronized (Singleton.class) {
                if(instance == null)
                    instance = new Singleton();
            }
        }
        return instance;
    }
}

這裏爲什麼要使用volatile修飾instance？主要在於instance = new Singleton()這句，這並非是一個原子操作，事實上在JVM中這句話大概做了下面3件事情:

（1）給instance分配內存

（2）調用Singleton的構造函數來初始化成員變量

（3）將instance對象指向分配的內存空間（執行完這步instance就爲非null了）。

但是在JVM的即時編譯器中存在指令重排序的優化。也就是說上面的第二步和第三步的順序是不能保證的，最終的執行順序可能是 1-2-3 也可能是 1-3-2。如果是後者，則在3執行完畢、2未執行之前，被線程二搶佔了，這時instance已經是非null了（但卻沒有初始化），所以線程二會直接返回instance，然後使用，然後順理成章地報錯。

9、Volatile的使用優化

在使用Volatile變量時，用一種追加字節的方式來優化隊列出隊和入隊的性能。追加字節能優化性能？這種方式看起來很神奇，但如果深入理解處理器架構就能理解其中的奧祕。讓我們先來看看LinkedTransferQueue這個類，它使用一個內部類類型來定義隊列的頭隊列（Head）和尾節點（tail），而這個內部類PaddedAtomicReference相對於父類AtomicReference只做了一件事情，就將共享變量追加到64字節。我們可以來計算下，一個對象的引用佔4個字節，它追加了15個變量共佔60個字節，再加上父類的Value變量，一共64個字節。

/* head of the queue /
private transient final PaddedAtomicReference head;

/* tail of the queue /
private transient final PaddedAtomicReference tail;

static final class PaddedAtomicReference extends AtomicReference {

// enough padding for 64bytes with 4byte refs
Object p0, p1, p2, p3, p4, p5, p6, p7, p8, p9, pa, pb, pc, pd, pe;

PaddedAtomicReference(T r) {
    super(r);
}

}

public class AtomicReference implements java.io.Serializable {

private volatile V value;

//省略其他代碼
}

爲什麼追加64字節能夠提高併發編程的效率呢？因爲對於英特爾酷睿i7，酷睿， Atom和NetBurst， Core Solo和Pentium M處理器的L1，L2或L3緩存的高速緩存行是64個字節寬，不支持部分填充緩存行，這意味着如果隊列的頭節點和尾節點都不足64字節的話，處理器會將它們都讀到同一個高速緩存行中，在多處理器下每個處理器都會緩存同樣的頭尾節點，當一個處理器試圖修改頭接點時會將整個緩存行鎖定，那麼在緩存一致性機制的作用下，會導致其他處理器不能訪問自己高速緩存中的尾節點，而隊列的入隊和出隊操作是需要不停修改頭接點和尾節點，所以在多處理器的情況下將會嚴重影響到隊列的入隊和出隊效率。Doug lea使用追加到64字節的方式來填滿高速緩衝區的緩存行，避免頭接點和尾節點加載到同一個緩存行，使得頭尾節點在修改時不會互相鎖定。

那麼是不是在使用Volatile變量時都應該追加到64字節呢？不是的。在兩種場景下不應該使用這種方式。

（1）緩存行非64字節寬的處理器，如P6系列和奔騰處理器，它們的L1和L2高速緩存行是32個字節寬。
（2）共享變量不會被頻繁的寫。因爲使用追加字節的方式需要處理器讀取更多的字節到高速緩衝區，這本身就會帶來一定的性能消耗，共享變量如果不被頻繁寫的話，鎖的機率也非常小，就沒必要通過追加字節的方式來避免相互鎖定。

Volatile原理分析

SpringMVC上傳入門

歡迎使用CSDN-markdown編輯器

SpringMVC上傳文件三種方式對比

Java面試問題總結

JAVA必背面試題和項目面試通關要點

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結