Java併發編程:volatile關鍵字解析

摘要:

  在 Java 併發編程中,要想使併發程序能夠正確地執行,必須要保證三條原則,即:原子性、可見性和有序性。只要有一條原則沒有被保證,就有可能會導致程序運行不正確。volatile關鍵字 被用來保證可見性,即保證共享變量的內存可見性以解決緩存一致性問題一旦一個共享變量被 volatile關鍵字 修飾,那麼就具備了兩層語義:內存可見性和禁止進行指令重排序。在多線程環境下,volatile關鍵字 主要用於及時感知共享變量的修改,並使得其他線程可以立即得到變量的最新值,例如,用於 修飾狀態標記量 和 Double-Check (雙重檢查)中。

    volatile關鍵字 雖然從字面上理解起來比較簡單,但是要用好不是一件容易的事情。由於 volatile關鍵字 是與 內存模型 緊密相關,因此在講述 volatile關鍵字 之前,我們有必要先去了解與內存模型相關的概念和知識,然後回頭再分析 volatile關鍵字 的實現原理,最後在給出 volatile關鍵字 的使用場景。

一. 內存模型的相關概念

大家都知道,計算機在執行程序時,每條指令都是在 CPU 中執行的,而執行指令過程中,勢必涉及到數據的讀取和寫入。由於程序運行過程中的臨時數據是存放在主存(物理內存)當中的,這時就存在一個問題:由於 CPU 執行速度很快,而從內存讀取數據和向內存寫入數據的過程跟 CPU 執行指令的速度比起來要慢的多,因此如果任何時候對數據的操作都要通過和內存的交互來進行,會大大降低指令執行的速度。因此,在 CPU 裏面就有了 高速緩存(寄存器)。 
   
  也就是說,在程序運行過程中,會將運算需要的數據從主存複製一份到 CPU 的高速緩存當中,那麼, CPU 進行計算時就可以直接從它的高速緩存讀取數據和向其中寫入數據,當運算結束之後,再將高速緩存中的數據刷新到主存當中。舉個簡單的例子,比如下面的這段代碼:

i = i + 1;
  • 1

  當線程執行這個語句時,會先從主存當中讀取 i 的值,然後複製一份到高速緩存當中,然後CPU執行指令對 i 進行加1操作,然後將數據寫入高速緩存,最後將高速緩存中 i 最新的值刷新到主存當中。

  這個代碼在單線程中運行是沒有任何問題的,但是在多線程中運行就會有問題了。在多核 CPU 中,每個線程可能運行於不同的 CPU 中,因此每個線程運行時有自己的高速緩存(對單核CPU來說,其實也會出現這種問題,只不過是以線程調度的形式來分別執行的)。本文我們以多核CPU爲例。

  比如,同時有兩個線程執行這段代碼,假如初始時 i 的值爲 0,那麼我們希望兩個線程執行完之後 i 的值變爲 2。但是事實會是這樣嗎?

  可能存在下面一種情況:初始時,兩個線程分別讀取 i 的值存入各自所在的 CPU 的高速緩存當中,然後線程1 進行加 1 操作,然後把 i 的最新值 1 寫入到內存。此時線程 2 的高速緩存當中 i 的值還是 0,進行加 1 操作之後,i 的值爲 1,然後線程 2 把 i 的值寫入內存。

  最終結果 i 的值是 1,而不是 2 。這就是著名的 緩存一致性問題 。通常稱這種被多個線程訪問的變量爲 共享變量 

  也就是說,如果一個變量在多個 CPU 中都存在緩存(一般在多線程編程時纔會出現),那麼就可能存在 緩存不一致 的問題。

  爲了解決緩存不一致性問題,在 硬件層面 上通常來說有以下兩種解決方法:

  1)通過在 總線加 LOCK# 鎖 的方式 (在軟件層面,效果等價於使用 synchronized 關鍵字)

  2)通過 緩存一致性協議 (在軟件層面,效果等價於使用 volatile 關鍵字)

  在早期的 CPU 當中,是通過在總線上加 LOCK# 鎖的形式來解決緩存不一致的問題。因爲 CPU 和其他部件進行通信都是通過總線來進行的,如果對總線加 LOCK# 鎖的話,也就是說阻塞了其他 CPU 對其他部件訪問(如內存),從而使得只能有一個CPU能使用這個變量的內存。比如上面例子中, 如果一個線程在執行 i = i + 1,如果在執行這段代碼的過程中,在總線上發出了 LCOK# 鎖的信號,那麼只有等待這段代碼完全執行完畢之後,其他 CPU 才能從變量 i 所在的內存讀取變量,然後進行相應的操作,這樣就解決了緩存不一致的問題。但是上面的方式會有一個問題,由於在鎖住總線期間,其他 CPU 無法訪問內存,導致效率低下。

  所以,就出現了 緩存一致性協議 ,其中最出名的就是 Intel 的 MESI 協議。MESI 協議保證了每個緩存中使用的共享變量的副本是一致的。它核心的思想是: 當 CPU 寫數據時,如果發現操作的變量是共享變量,即在其他 CPU 中也存在該變量的副本,會發出信號通知其他 CPU 將該變量的緩存行置爲無效狀態。因此,當其他 CPU 需要讀取這個變量時,發現自己緩存中緩存該變量的緩存行是無效的,那麼它就會從內存重新讀取。 


二.併發編程中的三個概念

  在併發編程中,我們通常會遇到以下三個問題: 原子性問題  可見性問題  有序性問題 。我們先看具體看一下這三個概念:


1、原子性

  原子性: 即一個操作或者多個操作 要麼全部執行並且執行的過程不會被任何因素打斷,要麼就都不執行。

  一個很經典的例子就是銀行賬戶轉賬問題:

  比如從賬戶A向賬戶B轉1000元,那麼必然包括2個操作:從賬戶A減去1000元,往賬戶B加上1000元。

  試想一下,如果這兩個操作不具備原子性,會造成什麼樣的後果。假如從賬戶 A 減去 1000 元之後,操作突然中止。然後又從 B 取出了 500 元,取出 500 元之後,再執行 往賬戶 B 加上 1000 元 的操作。這樣就會導致賬戶A雖然減去了 1000 元,但是賬戶 B 沒有收到這個轉過來的 1000 元。所以,這兩個操作必須要具備原子性才能保證不出現一些意外的問題。

  同樣地,反映到併發編程中會出現什麼結果呢?

  舉個最簡單的例子,大家想一下,假如爲一個32位的變量賦值過程不具備原子性的話,會發生什麼後果?

i = 9;
  • 1

  假若一個線程執行到這個語句時,我們暫且假設爲一個32位的變量賦值包括兩個過程:爲低16位賦值,爲高16位賦值。那麼就可能發生一種情況:當將低16位數值寫入之後,突然被中斷,而此時又有一個線程去讀取 i 的值,那麼讀取到的就是錯誤的數據,導致 數據不一致性 問題。


2、可見性

   可見性 是指當多個線程訪問同一個共享變量時,一個線程修改了這個變量的值,其他線程能夠立即看得到修改的值。

  舉個簡單的例子,看下面這段代碼:

//線程1執行的代碼
int i = 0;
i = 10;


//線程2執行的代碼
j = i;
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7

  假若執行 線程1 的是 CPU1,執行 線程2 的是 CPU2。由上面的分析可知,當 線程1 執行 i = 10 這句時,會先把 i 的初始值加載到 CPU1 的高速緩存中,然後賦值爲10,那麼在 CPU1 的高速緩存當中 i 的值變爲 10 了,卻沒有立即寫入到主存當中。此時,線程2 執行 j = i,它會先去主存讀取 i 的值並加載到 CPU2 的緩存當中,注意此時內存當中 i 的值還是 0,那麼就會使得 j 的值爲 0,而不是 10。

  這就是可見性問題,線程1 對變量 i 修改了之後,線程2 沒有立即看到 線程1 修改後的值。


3、有序性

  有序性:即程序執行的順序按照代碼的先後順序執行。舉個簡單的例子,看下面這段代碼:

int i = 0;              
boolean flag = false;
i = 1;                //語句1  
flag = true;          //語句2
  • 1
  • 2
  • 3
  • 4

  上面代碼定義了一個 int型 變量,定義了一個 boolean型 變量,然後分別對兩個變量進行賦值操作。從代碼順序上看,語句1 是在 語句2 前面的,那麼 JVM 在真正執行這段代碼的時候會保證 語句1 一定會在 語句2 前面執行嗎?不一定,爲什麼呢?這裏可能會發生 指令重排序(Instruction Reorder)

  下面解釋一下什麼是指令重排序,一般來說,處理器爲了提高程序運行效率,可能會對輸入代碼進行優化,它不保證程序中各個語句的執行先後順序同代碼中的順序一致,但是它會保證程序最終執行結果和代碼順序執行的結果是一致的(單線程情形下)

  比如上面的代碼中,語句1 和 語句2 誰先執行對最終的程序結果並沒有影響,那麼就有可能在執行過程中, 語句2 先執行而 語句1 後執行。但是要注意,雖然處理器會對指令進行重排序,但是它會保證程序最終結果會和代碼順序執行結果相同,那麼它靠什麼保證的呢?再看下面一個例子:

int a = 10;    //語句1
int r = 2;    //語句2
a = a + 3;    //語句3
r = a*a;     //語句4
  • 1
  • 2
  • 3
  • 4

  這段代碼有4個語句,那麼可能的一個執行順序是:

               指令重排序.jpg-8.7kB

  那麼可不可能是這個執行順序呢: 語句2 -> 語句1 -> 語句4 -> 語句3

  答案是不可能,因爲處理器在進行重排序時會考慮指令之間的 數據依賴性,如果一個指令 Instruction 2 必須用到 Instruction 1 的結果,那麼處理器會保證 Instruction 1 會在 Instruction 2 之前執行。

  

 雖然 重排序不會影響單個線程內程序執行的結果,但是多線程呢?下面,看一個例子:

//線程1:
context = loadContext();   //語句1
inited = true;             //語句2


//線程2:
while(!inited ){
  sleep()
}
doSomethingwithconfig(context);
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10

  上面代碼中,由於 語句1 和 語句2 沒有數據依賴性,因此可能會被重排序。假如發生了重排序,在 線程1 執行過程中先執行 語句2,而此時 線程2 會以爲初始化工作已經完成,那麼就會跳出 while循環 ,去執行 doSomethingwithconfig(context) 方法,而此時 context 並沒有被初始化,就會導致程序出錯。

  從上面可以看出,指令重排序不會影響單個線程的執行,但是會影響到線程併發執行的正確性。也就是說,要想使併發程序正確地執行,必須要保證原子性、可見性以及有序性。只要有一個沒有被保證,就有可能會導致程序運行不正確。


三. Java內存模型

  在前面談到了一些關於內存模型以及併發編程中可能會出現的一些問題。下面我們來看一下 Java內存模型,研究一下 Java內存模型 爲我們提供了哪些保證以及在 Java 中提供了哪些方法和機制來讓我們在進行多線程編程時能夠保證程序執行的正確性。

   
  在 Java虛擬機規範 中,試圖定義一種 Java內存模型(Java Memory Model,JMM) 來屏蔽各個硬件平臺和操作系統的內存訪問差異,以實現讓 Java 程序在各種平臺下都能達到一致的內存訪問效果。那麼,Java內存模型 規定了哪些東西呢,它定義了程序中變量的訪問規則,往大一點說是定義了程序執行的次序。注意,爲了獲得較好的執行性能,Java內存模型並沒有限制執行引擎使用處理器的寄存器或者高速緩存來提升指令執行速度,也沒有限制編譯器對指令進行重排序。也就是說,在 Java內存模型 中,也會存在緩存一致性問題和指令重排序的問題。

  Java內存模型 規定所有的變量都是存在主存當中(類似於前面說的物理內存),每個線程都有自己的工作內存(類似於前面的高速緩存)。線程對變量的所有操作都必須在工作內存中進行,而不能直接對主存進行操作,並且每個線程不能訪問其他線程的工作內存。

  舉個簡單的例子:在java中,執行下面這個語句:

i  = 10;
  • 1

  執行線程必須先在自己的工作線程中對 變量i 所在的緩存進行賦值操作,然後再寫入主存當中,而不是直接將數值10寫入主存當中。那麼,Java語言本身對原子性、可見性以及有序性 提供了哪些保證呢?



1、原子性

在 Java 中,對基本數據類型的變量的 讀取 和 賦值 操作是原子性操作,即這些操作是不可被中斷的 : 要麼執行,要麼不執行。

  上面一句話雖然看起來簡單,但是理解起來並不是那麼容易。看下面一個例子,請分析以下哪些操作是原子性操作:

x = 10;         //語句1
y = x;         //語句2
x++;           //語句3
x = x + 1;     //語句4
  • 1
  • 2
  • 3
  • 4

  乍一看,有些朋友可能會說上面的四個語句中的操作都是原子性操作。其實 只有 語句1 是原子性操作,其他三個語句都不是原子性操作。

  語句1 是直接將數值 10 賦值給 x,也就是說線程執行這個語句的會直接將數值 10 寫入到工作內存中;

  語句2 實際上包含兩個操作,它先要去讀取 x 的值,再將 x 的值寫入工作內存。雖然,讀取 x 的值以及 將 x 的值寫入工作內存這兩個操作都是原子性操作,但是合起來就不是原子性操作了;

  同樣的,x++ 和 x = x+1 包括3個操作:讀取 x 的值,進行加 1 操作,寫入新的值。

  所以,上面四個語句只有 語句1 的操作具備原子性。也就是說,只有簡單的讀取、賦值(而且必須是將數字賦值給某個變量,變量之間的相互賦值不是原子操作)纔是原子操作。

  不過,這裏有一點需要注意:在32位平臺下,對64位數據的讀取和賦值是需要通過兩個操作來完成的,不能保證其原子性。但是好像在最新的JDK中,JVM 已經保證對64位數據的讀取和賦值也是原子性操作了。

  從上面可以看出,Java內存模型只保證了基本讀取和賦值是原子性操作,如果要實現更大範圍操作的原子性,可以通過 synchronized 和 Lock 來實現。由於 synchronized 和 Lock 能夠保證任一時刻只有一個線程執行該代碼塊,那麼自然就不存在原子性問題了,從而保證了原子性。


2、可見性

  對於可見性,Java 提供了 volatile關鍵字 來保證可見性。

  當一個共享變量被 volatile 修飾時,它會保證修改的值會立即被更新到主存,當有其他線程需要讀取時,它會去內存中讀取新值。而普通的共享變量不能保證可見性,因爲普通共享變量被修改之後,什麼時候被寫入主存是不確定的,當其他線程去讀取時,此時內存中可能還是原來的舊值,因此無法保證可見性。

  另外,通過 synchronized 和 Lock 也能夠保證可見性,synchronized 和 Lock 能保證同一時刻只有一個線程獲取鎖然後執行同步代碼,並且 在釋放鎖之前會將對變量的修改刷新到主存當中,因此可以保證可見性。


3、有序性

  在 Java內存模型中,允許編譯器和處理器對指令進行重排序,但是重排序過程不會影響到單線程程序的執行,卻會影響到多線程併發執行的正確性。

  在 Java 中,可以通過 volatile 關鍵字來保證一定的“有序性”(具體原理在下一節講述)。另外,我們千萬不能想當然地認爲,可以通過synchronized 和 Lock 來保證有序性,也就是說,不能由於 synchronized 和 Lock 可以讓線程串行執行同步代碼,就說它們可以保證指令不會發生重排序,這根本不是一個粒度的問題。

  另外,Java內存模型具備一些先天的“有序性”,即不需要通過任何手段就能夠得到保證的有序性,這個通常也稱爲 happens-before 原則。如果兩個操作的執行次序無法從happens-before原則推導出來,那麼它們就不能保證它們的有序性,虛擬機可以隨意地對它們進行重排序。

  下面就來具體介紹下 happens-before原則(先行發生原則):

  • 程序次序規則:一個線程內,按照代碼順序,書寫在前面的操作先行發生於書寫在後面的操作;

  • 鎖定規則:一個unLock操作先行發生於後面對同一個鎖額lock操作;

  • volatile 變量規則:對一個變量的寫操作先行發生於後面對這個變量的讀操作;

  • 傳遞規則:如果操作 A 先行發生於操作 B,而操作 B 又先行發生於操作 C,則可以得出操作 A 先行發生於操作 C ;

  • 線程啓動規則:Thread對象的start()方法先行發生於此線程的每個一個動作;

  • 線程中斷規則:對線程interrupt()方法的調用先行發生於被中斷線程的代碼檢測到中斷事件的發生;

  • 線程終結規則:線程中所有的操作都先行發生於線程的終止檢測,我們可以通過Thread.join()方法結束、Thread.isAlive()的返回值手段檢測到線程已經終止執行;

  • 對象終結規則:一個對象的初始化完成先行發生於他的finalize()方法的開始。

      這八條原則摘自《深入理解Java虛擬機》。這八條規則中,前四條規則是比較重要的,後四條規則都是顯而易見的。下面我們來解釋一下前四條規則:

      對於程序次序規則來說,我的理解就是一段程序代碼的執行在單個線程中看起來是有序的。注意,雖然這條規則中提到“書寫在前面的操作先行發生於書寫在後面的操作”,這個應該是程序看起來執行的順序是按照代碼順序執行的,因爲虛擬機可能會對程序代碼進行指令重排序。雖然進行重排序,但是最終執行的結果是與程序順序執行的結果一致的,它只會對不存在數據依賴性的指令進行重排序。因此,在單個線程中,程序執行看起來是有序執行的,這一點要注意理解。事實上,這個規則是用來保證程序在單線程中執行結果的正確性,但無法保證程序在多線程中執行的正確性。

      第二條規則也比較容易理解,也就是說無論在單線程中還是多線程中,同一個鎖如果出於被鎖定的狀態,那麼必須先對鎖進行了釋放操作,後面才能繼續進行 lock 操作。

      第三條規則是一條比較重要的規則,也是後文將要重點講述的內容。直觀地解釋就是,如果一個線程先去寫一個變量,然後一個線程去進行讀取,那麼寫入操作肯定會先行發生於讀操作。

      第四條規則實際上就是體現 happens-before 原則具備傳遞性。


四.深入剖析 volatile 關鍵字

1、volatile關鍵字的兩層語義

  一旦一個共享變量(類的成員變量、類的靜態成員變量)被 volatile 修飾後,那麼就具備了兩層語義:

  1)保證了不同線程對共享變量進行操作時的可見性,即一個線程修改了某個變量的值,這個新值對其他線程來說是 立即可見 的;

  2)禁止進行指令重排序。

  先看一段代碼,假如 線程1 先執行,線程2 後執行:

//線程1
boolean stop = false;
while(!stop){
    doSomething();
}


//線程2
stop = true;

  這段代碼是很典型的一段代碼,很多人在中斷線程時可能都會採用這種標記辦法。但是事實上,這段代碼會完全運行正確麼?即一定會將線程中斷麼?不一定,也許在大多數時候,這個代碼能夠把線程中斷,但是也有可能會導致無法中斷線程(雖然這個可能性很小,但是隻要一旦發生這種情況就會造成死循環了)。

           線程讀取數據模型

  下面解釋一下這段代碼爲何有可能導致無法中斷線程。在前面已經解釋過,如上圖所示,每個線程在運行過程中都有自己的工作內存,那麼 線程1 在運行的時候,會將 stop 變量的值拷貝一份放在自己的工作內存當中。那麼,當 線程2 更改了 stop變量 的值之後,可能會出現以下兩種情形:

  • 線程2 對變量的修改沒有立即刷入到主存當中;

  • 即使 線程2 對變量的修改立即反映到主存中,線程1 也可能由於沒有立即知道 線程2 對stop變量的更新而一直循環下去。

這兩種情形都會導致 線程1 處於死循環。但是,用 volatile關鍵字 修飾後就變得不一樣了,如下圖所示:

  ① 使用 volatile 關鍵字會強制將修改的值立即寫入主存;

  ② 使用 volatile 關鍵字的話,當 線程2 進行修改時,會導致 線程1 的工作內存中緩存變量stop的緩存行無效(反映到硬件層的話,就是CPU的 L1 或者 L2 緩存中對應的緩存行無效);

  ③ 由於 線程1 的工作內存中緩存變量stop的緩存行無效,所以,線程1 再次讀取變量stop的值時會去主存讀取。

  綜上,在 線程2 修改 stop 值時(當然這裏包括兩個操作,修改 線程2 工作內存中的值,然後將修改後的值寫入內存),會使得 線程1 的工作內存中緩存變量 stop 的緩存行無效,然後 線程1 讀取時,會發現自己的緩存行無效從而去對應的主存讀取最新的值 。簡化一下,通過使用 volatile 關鍵字,如下圖所示,線程會及時將變量的新值更新到主存中,並且保證其他線程能夠立即讀到該值。這樣,線程1 讀取到的就是最新的、正確的值。 
            這裏寫圖片描述


  下面通過兩個例子更好地瞭解關鍵字 volatile 的作用。下面先看 示例1:

//資源類
class MyList {

    // 臨界資源
    private  List list = new ArrayList();

    // 對臨界資源的訪問
    public void add() {
        list.add("rico");
    }

    public int size() {
        return list.size();
    }
}

// 線程B
class ThreadB extends Thread {

    private MyList list;

    public ThreadB(MyList list) {
        super();
        this.list = list;
    }

    @Override
    public void run() { // 任務 B
        try {
            while (true) {
                if (list.size() == 2) {
                    System.out.println("list中的元素個數爲2了,線程b要退出了!");
                    throw new InterruptedException();
                }
            }
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

// 線程A
class ThreadA extends Thread {

    private MyList list;

    public ThreadA(MyList list) {
        super();
        this.list = list;
    }

    @Override
    public void run() { // 任務 A
        try {
            for (int i = 0; i < 3; i++) {
                list.add();
                System.out.println("添加了" + (i + 1) + "個元素");
                Thread.sleep(1000);
            }
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
    }
}

// 測試
public class Test {

    public static void main(String[] args) {
        MyList service = new MyList();

        ThreadA a = new ThreadA(service);
        a.setName("A");
        a.start();

        ThreadB b = new ThreadB(service);
        b.setName("B");
        b.start();
    }
}

運行結果如下所示:

             volatile關鍵字例證1.png-16.4kB


             volatile關鍵字例證2.png-22.3kB

  第一個運行結果是在沒有使用volatile關鍵字的情況下產生的,第二個運行結果是在使用volatile關鍵字的情況下產生的。

  特別地,博友 qq_27571221(王小軍08)提到, “若將 類ThreadA 中的 run()方法中的 Thread.sleep(1000);去掉,上述兩種運行結果都有可能出現。”事實上,之所以會出現這種情況,究其根本,是由線程獲得CPU執行的不確定性引起的。也就是說,在使用volatile關鍵字修飾共享變量list的前提下,去掉代碼Thread.sleep(1000);後,之所以也會出現第一種運行結果是因爲存在這樣一種情形:線程A 早已運行結束但線程B纔剛剛開始執行或尚未開始執行,即串行執行的情形。總的來說,在類ThreadA 中的 run()方法中添加 Thread.sleep(1000);的原因就是 爲了保證線程A、B 能交替執行,防止上述情形的出現。在此,感謝博友 qq_27571221(王小軍08)積極參與本問題的討論。


示例2:

public class TestVolatile {

    public static void main(String[] args) {

        ThreadDemo td = new ThreadDemo();
        new Thread(td, "ThreadDemo").start();

        while (true) {
            // 加上下面三句代碼的任意一句,程序都會正常結束:
            // System.out.println("!!");                              //...語句1
            // synchronized (TestVolite.class) {}                     //...語句2
            //TestVolite.test2();                                    //...語句3

            // 若只加上下面一句代碼,程序都會死循環:
            // TestVolite.test1();                                  //...語句4

            if (td.flag) {
                System.out.println("線程 " + Thread.currentThread().getName()
                        + " 即將跳出while循環體... ");
                break;
            }
        }
    }

    public static void test1() {}

    public synchronized static void test2() {}
}

class ThreadDemo implements Runnable {

    public boolean flag = false;

    @Override
    public void run() {
        try {
            Thread.sleep(2000);
        } catch (InterruptedException e) {
        }
        flag = true;
        System.out.println("線程 " + Thread.currentThread().getName() + " 執行完畢: "
                + "置  flag= " + flag + " ...");
    }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35
  • 36
  • 37
  • 38
  • 39
  • 40
  • 41
  • 42
  • 43
  • 44

  上述程序運行結果如下圖:

           Case0.png-16.7kB

  下面對該程序分以下 5 種情形進行修改並討論,如下所示:


Case 1:只用 volatile 關鍵字修飾 類ThreadDemo 中的共享變量 flag
運行結果爲: 
       Case 1.png-19.1kB

Case 2:只取消對語句1的註釋
運行結果爲: 
         Case 2.png-33.1kB
Case 3:只取消對語句2的註釋
運行結果爲: 
          Case 3.png-33.1kB

Case 4:只取消對語句3的註釋
運行結果爲: 
          Case 4.png-33.1kB

Case 5:只取消對語句4的註釋
運行結果爲: 
          Case 5.png-33.1kB

  關於上面五種情形,情形1 和 情形5 很容易理解,此不贅述。

  但是,對於上面的 第 2、3、4 三種情形,可能有很多朋友就不能理解了,特別是 第2種情形。其實,這三種情形都反映了一個問題:在我們不使用 volatile 關鍵字修飾共享變量去保證其可見性時,那麼線程是不是始終一直從自己的工作內存中讀取變量的值呢? 什麼情況下,線程工作內存中的變量值纔會與主存中的同步並取得一致狀態呢?

  事實上,除了 volatile 可以保證內存可見性外,synchronized 也可以保證可見性,因爲每次運行synchronized塊 或者 synchronized方法都會導致線程工作內存與主存的同步,使得其他線程可以取得共享變量的最新值。也就是說,synchronized 語義範圍不但包括 volatile 具有的可見性,也包括原子性,但不能禁止指令重排序,這是二者一個功能上的差異。說到這裏,朋友應該就理解了 情形3 和 情形4 了。但是,情形2 怎麼也會導致類似於 情形3 和 情形4 的效果呢? 因爲 System.out.println() 方法裏面包含 synchronized塊, 我們看完它的源碼就大徹大悟了,如下:

public void println(String x) {  
    synchronized (this) {         // synchronized 塊
        print(x);  
        newLine();  
    }  
}  
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6

  在此,特別感謝CSDN博友 Geek-k(u010395144) 所提出的問題,是他的提問,我才能更好的詮釋這個問題,更好的提升自己,更好的幫助更多的朋友。更多關於 synchronized關鍵字 的介紹請移步我的另一篇博文《Java 併發:內置鎖 Synchronized》。更多關於 Java多線程 方面的知識請移步我的專欄《Java併發編程學習筆記》


2、volatile 保證原子性嗎?

  從上面知道, volatile 關鍵字保證了操作的可見性,但是 volatile 能保證對變量的操作是原子性嗎?

  下面看一個例子:

//線程類
class MyThread extends Thread {
    // volatile 共享靜態變量,類成員
    public volatile static int count;

    private static void addCount() {
        for (int i = 0; i < 100; i++) {
            count++;
        }
        System.out.println("count=" + count);
    }

    @Override
    public void run() {
        addCount();
    }
}

//測試類
public class Run {
    public static void main(String[] args) {
        //創建 100個線程並啓動
        MyThread[] mythreadArray = new MyThread[100];
        for (int i = 0; i < 100; i++) {
            mythreadArray[i] = new MyThread();
        }

        for (int i = 0; i < 100; i++) {
            mythreadArray[i].start();
        }
    }
}/* Output(循環): 
       ... ...
       count=9835
 *///:~
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34
  • 35

  大家想一下這段程序的輸出結果是多少?也許有些朋友認爲是 10000。但是事實上運行它會發現每次運行結果都不一致,都是一個 小於 10000 的數字。可能有的朋友就會有疑問,不對啊,上面是對變量 count 進行自增操作,由於 volatile 保證了可見性,那麼在每個線程中對 count 自增完之後,在其他線程中都能看到修改後的值啊,所以有 100個 線程分別進行了 100 次操作,那麼最終 count 的值應該是 100*100=10000。

  這裏面就有一個誤區了,volatile 關鍵字能保證可見性沒有錯,但是上面的程序錯在沒能保證原子性。可見性只能保證每次讀取的是最新的值,但是 volatile 沒辦法保證對變量的操作的原子性。在前面已經提到過,自增操作是不具備原子性的,它包括 讀取變量的原始值、進行加1操作 和 寫入工作內存 三個原子操作。那麼就是說,這三個子操作可能會分割開執行,所以就有可能導致下面這種情況出現:

  假如某個時刻 變量count 的值爲 10,線程1 對變量進行自增操作,線程1 先讀取了 變量count 的原始值,然後 線程1 被阻塞了;然後,線程2 對變量進行自增操作,線程2 也去讀取 變量count 的原始值,由於 線程1 只是對 變量count 進行讀取操作,而沒有對變量進行修改操作,所以不會導致 線程2 的工作內存中緩存變量 count 的緩存行無效,所以 線程2 會直接去主存讀取 count的值 ,發現 count 的值是 10,然後進行加 1 操作。注意,此時 線程2 只是執行了 count + 1 操作,還沒將其值寫到 線程2 的工作內存中去!此時線程2 被阻塞,線程1 進行加 1 操作時,注意操作數count仍然是 10!然後,線程2 把 11 寫入工作內存並刷到主內存。雖然此時 線程1 能感受到 線程2 對count的修改,但由於線程1只剩下對count的寫操作了,而不必對count進行讀操作了,所以此時 線程2 對count的修改並不能影響到 線程1。於是,線程1 也將 11 寫入工作內存並刷到主內存。也就是說,兩個線程分別進行了一次自增操作後,count 只增加了 1。下圖演示了這種情形:

             這裏寫圖片描述

  進一步地,將上述代碼修改成下面示例的樣子以後,這個問題就迎刃而解:

//線程類
class MyThread extends Thread {
    // 既然使用 synchronized關鍵字 ,就沒必要使用 volatile關鍵字了
    public static int count;

    //注意必須添加 static 關鍵字,這樣synchronized 與 static 鎖的就是 Mythread.class 對象了,
    //也就達到同步效果了
    private synchronized static void addCount() {
        for (int i = 0; i < 100; i++) {
            count++;
        }
        System.out.println("count=" + count);
    }

    @Override
    public void run() {
        addCount();
    }
}

//測試類
public class Run {
    public static void main(String[] args) {
        //創建 100個線程並啓動
        MyThread[] mythreadArray = new MyThread[100];
        for (int i = 0; i < 100; i++) {
            mythreadArray[i] = new MyThread();
        }

        for (int i = 0; i < 100; i++) {
            mythreadArray[i].start();
        }
    }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17
  • 18
  • 19
  • 20
  • 21
  • 22
  • 23
  • 24
  • 25
  • 26
  • 27
  • 28
  • 29
  • 30
  • 31
  • 32
  • 33
  • 34

  使用 Lock 和 Java 1.5 所提供的 java.util.concurrent.atomic 包來保證線程安全性將在後面的博文中進行介紹。


五. 使用 volatile 關鍵字的場景

  synchronized 關鍵字是防止多個線程同時執行一段代碼,那麼就會很影響程序執行效率;而 volatile 關鍵字在某些情況下性能要優於 synchronized,但是要注意 volatile 關鍵字是無法替代 synchronized 關鍵字的,因爲 volatile 關鍵字無法保證操作的原子性。通常來說,使用 volatile 必須具備以下兩個條件:

  1)對變量的寫操作不依賴於當前值;

  2)該變量沒有包含在具有其他變量的不變式中。

  實際上,這些條件表明,可以被寫入 volatile 變量的這些有效值 獨立於任何程序的狀態,包括變量的當前狀態。事實上,上面的兩個條件就是保證對 該volatile變量 的操作是原子操作,這樣才能保證使用 volatile關鍵字 的程序在併發時能夠正確執行。

特別地,關鍵字 volatile 主要使用的場合是:

  在多線程環境下及時感知共享變量的修改,並使得其他線程可以立即得到變量的最新值。


1、狀態標記量

// 示例 1
volatile boolean flag = false;

while(!flag){
    doSomething();
}

public void setFlag() {
    flag = true;
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
// 示例 2
volatile boolean inited = false;


//線程1:
context = loadContext();  
inited = true;            


//線程2:
while(!inited ){
    sleep()
}
doSomethingwithconfig(context);
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14

  更多關於 volatile 在狀態標記量方面的應用,請移步我的博文《Java 併發:線程間通信與協作》


2、Double-Check (雙重檢查)

class Singleton{
    private volatile static Singleton instance = null;

    private Singleton() {

    }

    public static Singleton getInstance() {
        if(instance==null) {
            synchronized (Singleton.class) {
                if(instance==null)
                    instance = new Singleton();
            }
        }
        return instance;
    }
}
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9
  • 10
  • 11
  • 12
  • 13
  • 14
  • 15
  • 16
  • 17

  更多關於 Double-Check (雙重檢查)的定義與應用場景 的介紹,請移步我的博文《徹頭徹尾理解單例模式與多線程》


六. 小結

  關鍵字volatile 與內存模型緊密相關,是線程同步的輕量級實現,其性能要比 synchronized關鍵字 好。在作用對象和作用範圍上, volatile 用於修飾變量,而 synchronized關鍵字 用於修飾方法和代碼塊,而且 synchronized 語義範圍不但包括 volatile擁有的可見性,還包括volatile 所不具有的原子性,但不包括 volatile 擁有的有序性,即允許指令重排序。因此,在多線程環境下,volatile關鍵字 主要用於及時感知共享變量的修改,並保證其他線程可以及時得到變量的最新值。可用以下文氏圖表示 synchronized 和 volatile語義範圍:

              這裏寫圖片描述 
               

                     

               
  更多關於 synchronized關鍵字 的介紹請移步我的另一篇博文《Java 併發:內置鎖 Synchronized》。

  更多關於 Java多線程 方面的知識請移步我的專欄《Java併發編程學習筆記》

  更多關於 Double-Check (雙重檢查)的定義與應用場景 的介紹,請移步我的博文《徹頭徹尾理解單例模式與多線程》

  更多關於 volatile 在狀態標記量方面的應用,請移步我的博文《Java 併發:線程間通信與協作》


七. 鳴謝

  特別感謝 Geek-k(u010395144) 和 qq_27571221(王小軍08) 兩位CSDN博友對本文章的關注與積極討論,同時感謝其他朋友對有關內容的關注。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章