你的 Java 併發程序 Bug,100% 是這幾個原因造成的

可見性問題

可見性是指一個線程對共享變量進行了修改,其他線程能夠立馬看到該共享變量更新後的值,這視乎是一個合情合理的要求,但是在多線程的情況下,可能就要讓你失望了,由於每個 CPU 都有自己的緩存,每個線程使用的可能是不同的 CPU ,這就會出現數據可見性的問題,先來看看下面這張圖:

CUP 緩存於主內存的關係

對於一個共享變量 count ,每個 CPU 緩存中都有一個 count 副本,每個線程對共享變量 count 的操作的只能操作自己所在 CPU 緩存中的副本,不能直接操作主存或者其他 CPU 緩存中的副本,這也就產生了數據差異。由於可見性在多線程情況下造成程序問題的典型案例就是變量的累加,如下面這段程序:

public class Demo {

    private int count = 0;

    // 每個線程爲count + 10000
    public void add() {
        for (int i = 0; i < 10000; i++) {
            count += 1;
        }
    }

    public static void main(String[] args) throws InterruptedException {

        for (int i = 0; i < 10; i++) {
            Demo demo = new Demo();
            Thread t1 = new Thread(() -> {
                demo.add();
            });
            Thread t2 = new Thread(() -> {
                demo.add();
            });
            t1.start();
            t2.start();
            t1.join();
            t2.join();
            System.out.println(demo.count);
        }
    }
}

我們使用了 2 個程序對 count 變量累加,每個線程累加 10000 次,按道理來說最終結果應該是 20000 次,但是你多次執行後,你會發現結果不一定是 20000 次,這就是由於共享變量的可見性造成的。

我們啓動了兩個線程 t1 和 t2,線程啓動的時候會把當前主內存的 count 讀入到自己的 CPU 緩存當中,這時候 count 的值可能是 0 也可能是 1 或者其他,我們就默認爲 0,每個線程都會執行 count += 1 操作,這是一個並行操作,CPU1 和 CPU2 緩存中的 count 都是 1,然後他們分別將自己緩存中的count 寫回到主內存中,這時候主內存中的 count 也是 1 ,並不是我們預計的 2,。這個原因就是數據可見性造成的。

原子性問題

原子性:即一個操作或者多個操作,要麼全部執行並且執行的過程不會被任何因素打斷,要麼就都不執行。這個原子性針對的是 CPU 級別的,並不是我們 Java 代碼裏面的原子性,拿我們可見性 Demo 程序中的 count += 1;命令爲例,這一條 Java 命令最終會被編譯成如下三條 CPU 指令:

  • 把變量 count 從內存加載到 CPU 的寄存器,假設 count = 1
  • 在寄存器中執行 count +1 操作,count = 1+1 =2
  • 將結果 +1 後的 count 寫入內存

這是一個典型的 讀-改-寫 的操作,但是它不是原子性的,因爲 多核CPU 之間有競爭關係,並不是某一個 CPU 一直執行,他們會不斷的搶佔執行權、釋放執行權,所以上面三條指令就不一定是原子性的,下圖是兩個線程 count += 1命令的模擬流程:

非原子性操作

線程1 所在的 CPU 執行完前兩條指令後,執行權被 線程2 所在的 CPU 搶佔了,這時候線程1 所在的 CPU 執行掛起等待再次獲取執行權,線程2 所在的 CPU 獲取到執行權之後,先從內存中讀取 count,此時內存中的 count 還是 1,線程2 所在的 CPU 恰好執行完了這三條指令,線程2 執行完之後內存中的 count 就等於 2 了,這時候線程1 再次獲取了執行權,這時候線程1 只剩下最後一條將 count 寫回內存的命令,執行完之後,內存中的 count 的值還是 2 ,並不是我們預計的 3。

有序性問題

有序性:程序執行的順序按照代碼的先後順序執行,比如下面這段代碼

1  int i = 1;
2  int m = 11;
3  long x = 23L;

按照有序性的話就需要按照代碼的順序執行下來,但是執行結果不一定是按照這個順序來的,因爲 JVM 爲了提高程序的運行效率,會對上面的代碼按照 JVM 編譯器認爲最優的順序執行,從而可能打亂代碼的執行順序,是它會保證程序最終執行結果和代碼順序執行的結果是一致的,這也就是我們所說的指令重排序

由於指令重排序造成程序出 Bug 的典型案例就是:未加 volatile 關鍵字的雙重檢測鎖單例模式,如下代碼:

public class Singleton { 
	static Singleton instance; 
	public static Singleton getInstance(){ 
	// 第一次判斷
	if (instance == null) { 
		// 加鎖,只有一個線程能夠獲取鎖
		synchronized(Singleton.class) { 
			// 第二次判斷
			if (instance == null) 
				// 構建對象,這裏面就非常有學問了
				instance = new Singleton(); 
			} 
	}
	return instance; 
	} 
}

雙重檢測鎖方案看上去非常完美,但是在實際運行時卻會出 Bug,會出現對象逸出的問題,可能會得到一個未構建完的 Singleton 對象, 這個就是在構建 Singleton 對象時指令重排序的問題。我們先來看看構建對象理想型的操作指令:

  • 指令1:分配一塊內存 M;
  • 指令2:在內存 M 上初始化 Singleton 對象;
  • 指令3:然後 M 的地址賦值給 instance 變量。

但是實際在 JVM 編譯器上可能不是這樣,可能會被優化成如下指令:

  • 指令1:分配一塊內存 M;
  • 指令2:將 M 的地址賦值給 instance 變量;
  • 指令3:最後在內存 M 上初始化 Singleton 對象。

看上去一個小小的優化,也就是這麼一個小小的優化就會使你的程序不安全,假設搶到鎖的線程執行完指令2 之後,此時的 instance 已經不爲空了,這時候來了線程C,線程C 看到的 instance 已經是不爲空的了,就會直接返回 instance 對象,這時候的 instance 並未初始化成功,調用 instance 對象的方法或者成員變量時將有可能觸發空指針異常。可能的執行流程圖:

未加 volatile 關鍵字的雙重檢測鎖單例模式

上面就是造成 Java 程序在多線程情況下出 Bug 的三種原因,關於這些問題 JDK 公司也給出了相應的解決辦法,具體如下圖所示,這些解決辦法的更多細節,我們後面在細細道來。

併發解決機制

文章不足之處,望大家多多指點,共同學習,共同進步

最後

打個小廣告,歡迎掃碼關注微信公衆號:「平頭哥的技術博文」,一起進步吧。
平頭哥的技術博文

發佈了82 篇原創文章 · 獲贊 3850 · 訪問量 41萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章