高併發Java 三 Java內存模型和線程安全

網上很多資料在描述Java內存模型的時候,都會介紹有一個主存,然後每個工作線程有自己的工作內存。數據在主存中會有一份,在工作內存中也有一份。工作內存和主存之間會有各種原子操作去進行同步。


但是由於Java版本的不斷演變,內存模型也進行了改變。本文只講述Java內存模型的一些特性,無論是新的內存模型還是舊的內存模型,在明白了這些特性以後,看起來也會更加清晰。

1. 原子性

  • 原子性是指一個操作是不可中斷的。即使是在多個線程一起執行的時候,一個操作一旦開始,就不會被其它線程干擾。

一般認爲cpu的指令都是原子操作,但是我們寫的代碼就不一定是原子操作了。

比如說i++。這個操作不是原子操作,基本分爲3個操作,讀取i,進行+1,賦值給i。

假設有兩個線程,當第一個線程讀取i=1時,還沒進行+1操作,切換到第二個線程,此時第二個線程也讀取的是i=1。隨後兩個線程進行後續+1操作,再賦值回去以後,i不是3,而是2。顯然數據出現了不一致性。

再比如在32位的JVM上面去讀取64位的long型數值,也不是一個原子操作。當然32位JVM讀取32位整數是一個原子操作。

2. 有序性

  • 在併發時,程序的執行可能就會出現亂序。

計算機在執行代碼時,不一定會按照程序的順序來執行。

class OrderExample { 
		int a = 0; 
		boolean flag = false; 
		public void writer() 
		{ 
			a = 1; 
			flag = true; 
		} 
		public void reader() 
		{ 
			if (flag) 
			{ 
				int i = a +1;  
			}
		} 
	}


比如上述代碼,兩個方法分別被兩個線程調用。按照常理,寫線程應該先執行a=1,再執行flag=true。當讀線程進行讀的時候,i=2;

但是因爲a=1和flag=true,並沒有邏輯上的關聯。所以有可能執行的順序顛倒,有可能先執行flag=true,再執行a=1。這時當flag=true時,切換到讀線程,此時a=1還沒有執行,那麼讀線程將i=1。

當然這個不是絕對的。是有可能會發生亂序,有可能不發生。

那麼爲什麼會發生亂序呢?這個要從cpu指令說起,Java中的代碼被編譯以後,最後也是轉換成彙編碼的。

一條指令的執行是可以分爲很多步驟的,假設cpu指令分爲以下幾步

  • 取指 IF
  • 譯碼和取寄存器操作數 ID
  • 執行或者有效地址計算 EX
  • 存儲器訪問 MEM
  • 寫回 WB
假設這裏有兩條指令


一般來說我們會認爲指令是串行執行的,先執行指令1,然後再執行指令2。假設每個步驟需要消耗1個cpu時間週期,那麼執行這兩個指令需要消耗10個cpu時間週期,這樣做效率太低。事實上指令都是並行執行的,當然在第一條指令在執行IF的時候,第二條指令是不能進行IF的,因爲指令寄存器等不能被同時佔用。所以就如上圖所示,兩條指令是一種相對錯開的方式並行執行。當指令1執行ID的時候,指令2執行IF。這樣只用6個cpu時間週期就執行了兩個指令,效率比較高。

按照這個思路我們來看下A=B+C的指令是如何執行的。


如圖所示,ADD操作時有一個空閒(X)操作,因爲當想讓B和C相加的時候,在圖中ADD的X操作時,C還沒從內存中讀取(當MEM操作完成時,C才從內存中讀取。這裏會有一個疑問,此時還沒有回寫(WB)到R2中,怎麼會將R1與R1相加。那是因爲在硬件電路當中,會使用一種叫“旁路”的技術直接把數據從硬件當中讀取出來,所以不需要等待WB執行完才進行ADD)。所以ADD操作中會有一個空閒(X)時間。在SW操作中,因爲EX指令不能和ADD的EX指令同時進行,所以也會有一個空閒(X)時間。

接下來舉個稍微複雜點的例子

a=b+c 
d=e-f

對應的指令如下圖


原因和上面的類似,這裏就不分析了。我們發現,這裏的X很多,浪費的時間週期很多,性能也被影響。有沒有辦法使X的數量減少呢?

我們希望用一些操作把X的空閒時間填充掉,因爲ADD與上面的指令有數據依賴,我們希望用一些沒有數據依賴的指令去填充掉這些因爲數據依賴而產生的空閒時間。


我們將指令的順序進行了改變


改變了指令順序以後,X被消除了。總體的運行時間週期也減少了。

指令重排可以使流水線更加順暢

當然指令重排的原則是不能破壞串行程序的語義,例如a=1,b=a+1,這種指令就不會重排了,因爲重排的串行結果和原先的不同。

指令重排只是編譯器或者CPU的優化一種方式,而這種優化就造成了本章一開始程序的問題。

如何解決呢?用volatile關鍵字,這個後面的系列會介紹到。

3. 可見性

  • 可見性是指當一個線程修改了某一個共享變量的值,其他線程是否能夠立即知道這個修改。

可見性問題可能有各個環節產生。比如剛剛說的指令重排也會產生可見性問題,另外在編譯器的優化或者某些硬件的優化都會產生可見性問題。

比如某個線程將一個共享值優化到了內存中,而另一個線程將這個共享值優化到了緩存中,當修改內存中值的時候,緩存中的值是不知道這個修改的。

比如有些硬件優化,程序在對同一個地址進行多次寫時,它會認爲是沒有必要的,只保留最後一次寫,那麼之前寫的數據在其他線程中就不可見了。

總之,可見性的問題大多都源於優化。

接下來看一個Java虛擬機層面產生的可見性問題

問題來自於一個Blog

package edu.hushi.jvm;
 
/**
 *
 * @author -10
 *
 */
public class VisibilityTest extends Thread {
 
    private boolean stop;
 
    public void run() {
        int i = 0;
        while(!stop) {
            i++;
        }
        System.out.println("finish loop,i=" + i);
    }
 
    public void stopIt() {
        stop = true;
    }
 
    public boolean getStop(){
        return stop;
    }
    public static void main(String[] args) throws Exception {
        VisibilityTest v = new VisibilityTest();
        v.start();
 
        Thread.sleep(1000);
        v.stopIt();
        Thread.sleep(2000);
        System.out.println("finish main");
        System.out.println(v.getStop());
    }
 
}


代碼很簡單,v線程一直不斷的在while循環中i++,直到主線程調用stop方法,改變了v線程中的stop變量的值使循環停止。

看似簡單的代碼運行時就會出現問題。這個程序在 client 模式下是能停止線程做自增操作的,但是在 server 模式先將是無限循環。(server模式下JVM優化更多)

64位的系統上面大多都是server模式,在server模式下運行:

finish main
true


只會打印出這兩句話,而不會打印出finish loop。可是能夠發現stop的值已經是true了。

該Blog作者用工具將程序還原爲彙編代碼

這裏只截取了一部分彙編代碼,紅色部分爲循環部分,可以清楚得看到只有在0x0193bf9d才進行了stop的驗證,而紅色部分並沒有取stop的值,所以才進行了無限循環。

這是JVM優化後的結果。如何避免呢?和指令重排一樣,用volatile關鍵字。

如果加入了volatile,再還原爲彙編代碼就會發現,每次循環都會get一下stop的值。

接下來看一些在“Java語言規範”中的示例


上圖說明了指令重排將會導致結果不同。


上圖使r5=r2的原因是,r2=r1.x,r5=r1.x,在編譯時直接將其優化成r5=r2。最後導致結果不同。

4. Happen-Before

  • 程序順序原則:一個線程內保證語義的串行性
  • volatile規則:volatile變量的寫,先發生於讀,這保證了volatile變量的可見性
  • 鎖規則:解鎖(unlock)必然發生在隨後的加鎖(lock)前
  • 傳遞性:A先於B,B先於C,那麼A必然先於C
  • 線程的start()方法先於它的每一個動作
  • 線程的所有操作先於線程的終結(Thread.join())
  • 線程的中斷(interrupt())先於被中斷線程的代碼
  • 對象的構造函數執行結束先於finalize()方法
這些原則保證了重排的語義是一致的。

5. 線程安全的概念

指某個函數、函數庫在多線程環境中被調用時,能夠正確地處理各個線程的局部變量,使程序功能正確完成。

比如最開始所說的i++的例子

就會導致線程不安全。

關於線程安全的詳情使用,請參考以前寫的這篇Blog,或者關注後續系列,也會談到相關內容。

發佈了37 篇原創文章 · 獲贊 102 · 訪問量 21萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章