Java併發指南開篇:Java併發編程學習大綱


這裏不僅僅是指使用簡單的多線程編程,或者使用juc的某個類。當然這些都是併發編程的基本知識,除了使用這些工具以外,Java併發編程中涉及到的技術原理十分豐富。爲了更好地把併發知識形成一個體系,也鑑於本人沒有能力寫出這類文章,於是參考幾位併發編程專家的博客和書籍,做一個簡單的整理。


一:併發基礎和多線程

首先需要學習的就是併發的基礎知識,什麼是併發,爲什麼要併發,多線程的概念,線程安全的概念等。

然後學會使用Java中的Thread或是其他線程實現方法,瞭解線程的狀態轉換,線程的方法,線程的通信方式等。


二:JMM內存模型

任何語言最終都是運行在處理器上,JVM虛擬機爲了給開發者一個一致的編程內存模型,需要制定一套規則,這套規則可以在不同架構的機器上有不同實現,並且向上爲程序員提供統一的JMM內存模型。

所以瞭解JMM內存模型也是瞭解Java併發原理的一個重點,其中瞭解指令重排,內存屏障,以及可見性原理尤爲重要。

JMM只保證happens-before和as-if-serial規則,所以在多線程併發時,可能出現原子性,可見性以及有序性這三大問題。

下面的內容則會講述Java是如何解決這三大問題的。


三:synchronized,volatile,final等關鍵字

對於併發的三大問題,volatile可以保證原子性和可見性,synchronized三種特性都可以保證(允許指令重排)。

synchronized是基於操作系統的mutex lock指令實現的,volatile和final則是根據JMM實現其內存語義。

此處還要了解CAS操作,它不僅提供了類似volatile的內存語義,並且保證操作原子性,因爲它是由硬件實現的。

JUC中的Lock底層就是使用volatile加上CAS的方式實現的。synchronized也會嘗試用cas操作來優化器重量級鎖。

瞭解這些關鍵字是很有必要的。


四:JUC包

在瞭解完上述內容以後,就可以看看JUC的內容了。

JUC提供了包括Lock,原子操作類,線程池,同步容器,工具類等內容。

這些類的基礎都是AQS,所以瞭解AQS的原理是很重要的。

除此之外,還可以瞭解一下Fork/Join,以及JUC的常用場景,比如生產者消費者,阻塞隊列,以及讀寫容器等。


五:實踐

上述這些內容,除了JMM部分的內容比較不好實現之外,像是多線程基本使用,JUC的使用都可以在代碼實踐中更好地理解其原理。多嘗試一些場景,或者在網上找一些比較經典的併發場景,或者參考別人的例子,在實踐中加深理解,還是很有必要的。



六:補充

由於很多Java新手可能對併發編程沒什麼概念,在這裏放一篇不錯的總結,簡要地提幾個併發編程中比要重要的點,也是比較基本的點嗎,算是拋磚引玉,開個好頭,在大致瞭解了這些基礎內容以後,才能更好地開展後面詳細內容的學習。


1.併發編程三要素

  • 原子性
    原子,即一個不可再被分割的顆粒。在Java中原子性指的是一個或多個操作要麼全部執行成功要麼全部執行失敗。

  • 有序性
    程序執行的順序按照代碼的先後順序執行。(處理器可能會對指令進行重排序)

  • 可見性
    當多個線程訪問同一個變量時,如果其中一個線程對其作了修改,其他線程能立即獲取到最新的值。

2. 線程的五大狀態

  • 創建狀態
    當用 new 操作符創建一個線程的時候

  • 就緒狀態
    調用 start 方法,處於就緒狀態的線程並不一定馬上就會執行 run 方法,還需要等待CPU的調度

  • 運行狀態
    CPU 開始調度線程,並開始執行 run 方法

  • 阻塞狀態
    線程的執行過程中由於一些原因進入阻塞狀態
    比如:調用 sleep 方法、嘗試去得到一個鎖等等

  • 死亡狀態
    run 方法執行完 或者 執行過程中遇到了一個異常

3.悲觀鎖與樂觀鎖

  • 悲觀鎖:每次操作都會加鎖,會造成線程阻塞。

  • 樂觀鎖:每次操作不加鎖而是假設沒有衝突而去完成某項操作,如果因爲衝突失敗就重試,直到成功爲止,不會造成線程阻塞。

4.線程之間的協作

4.1 wait/notify/notifyAll

這一組是 Object 類的方法
需要注意的是:這三個方法都必須在同步的範圍內調用

  • wait
    阻塞當前線程,直到 notify 或者 notifyAll 來喚醒

    wait有三種方式的調用
    wait()
    必要要由 notify 或者 notifyAll 來喚醒
    wait(long timeout)
    在指定時間內,如果沒有notify或notifAll方法的喚醒,也會自動喚醒。
    wait(long timeout,long nanos)
    本質上還是調用一個參數的方法
    public final void wait(long timeout, int nanos) throws InterruptedException {
          if (timeout < 0) {
                 throw new IllegalArgumentException("timeout value is negative");
           }
          if (nanos < 0 || nanos > 999999) {
                  throw new IllegalArgumentException(
                 "nanosecond timeout value out of range");
           }
           if (nanos > 0) {
                 timeout++;
           }
           wait(timeout);
    }

    • notify
      只能喚醒一個處於 wait 的線程

    • notifyAll
      喚醒全部處於 wait 的線程

4.2 sleep/yield/join

這一組是 Thread 類的方法

  • sleep
    讓當前線程暫停指定時間,只是讓出CPU的使用權,並不釋放鎖

  • yield
    暫停當前線程的執行,也就是當前CPU的使用權,讓其他線程有機會執行,不能指定時間。會讓當前線程從運行狀態轉變爲就緒狀態,此方法在生產環境中很少會使用到,官方在其註釋中也有相關的說明

          /**
          * A hint to the scheduler that the current thread is willing to yield
          * its current use of a processor. The scheduler is free to ignore this
          * hint.
          *
          * <p> Yield is a heuristic attempt to improve relative progression
          * between threads that would otherwise over-utilise a CPU. Its use
          * should be combined with detailed profiling and benchmarking to
          * ensure that it actually has the desired effect.
          *
          * <p> It is rarely appropriate to use this method. It may be useful
          * for debugging or testing purposes, where it may help to reproduce
          * bugs due to race conditions. It may also be useful when designing
          * concurrency control constructs such as the ones in the
          * {@link java.util.concurrent.locks} package.
          */

  • join
    等待調用 join 方法的線程執行結束,才執行後面的代碼
    其調用一定要在 start 方法之後(看源碼可知)
    使用場景:當父線程需要等待子線程執行結束才執行後面內容或者需要某個子線程的執行結果會用到 join 方法

5.valitate 關鍵字

5.1 定義

java編程語言允許線程訪問共享變量,爲了確保共享變量能被準確和一致的更新,線程應該確保通過排他鎖單獨獲得這個變量。Java語言提供了volatile,在某些情況下比鎖更加方便。如果一個字段被聲明成volatile,java線程內存模型確保所有線程看到這個變量的值是一致的。

valitate是輕量級的synchronized,不會引起線程上下文的切換和調度,執行開銷更小。

5.2 原理

1. 使用volitate修飾的變量在彙編階段,會多出一條lock前綴指令
2. 它確保指令重排序時不會把其後面的指令排到內存屏障之前的位置,也不會把前面的指令排到內存屏障的後面;即在執行到內存屏障這句指令時,在它前面的操作已經全部完成
3. 它會強制將對緩存的修改操作立即寫入主存
4. 如果是寫操作,它會導致其他CPU裏緩存了該內存地址的數據無效

5.3 作用

內存可見性
多線程操作的時候,一個線程修改了一個變量的值 ,其他線程能立即看到修改後的值
防止重排序
即程序的執行順序按照代碼的順序執行(處理器爲了提高代碼的執行效率可能會對代碼進行重排序)

並不能保證操作的原子性(比如下面這段代碼的執行結果一定不是100000)

    public class testValitate {
    public volatile int inc = 0;
    public void increase() {
        inc = inc + 1;
    }
    public static void main(String[] args) {
        final testValitate test = new testValitate();
        for (int i = 0; i < 100; i++) {
            new Thread() {
                public void run() {
                    for (int j = 0; j < 1000; j++)
                        test.increase();
                }
            }.start();
        }
        while (Thread.activeCount() > 2) {  //保證前面的線程都執行完
            Thread.yield();
        }
        System.out.println(test.inc);
     }
   }

6. synchronized 關鍵字

確保線程互斥的訪問同步代碼

6.1 定義

synchronized 是JVM實現的一種鎖,其中鎖的獲取和釋放分別是
monitorenter 和 monitorexit 指令,該鎖在實現上分爲了偏向鎖、輕量級鎖和重量級鎖,其中偏向鎖在 java1.6 是默認開啓的,輕量級鎖在多線程競爭的情況下會膨脹成重量級鎖,有關鎖的數據都保存在對象頭中

6.2 原理

加了 synchronized 關鍵字的代碼段,生成的字節碼文件會多出 monitorenter 和 monitorexit 兩條指令(利用javap -verbose 字節碼文件可看到關,關於這兩條指令的文檔如下:

  • monitorenter
    Each object is associated with a monitor. A monitor is locked if and only if it has an owner. The thread that executes monitorenter attempts to gain ownership of the monitor associated with objectref, as follows:
    • If the entry count of the monitor associated with objectref is zero, the thread enters the monitor and sets its entry count to one. The thread is then the owner of the monitor.
    • If the thread already owns the monitor associated with objectref, it reenters the monitor, incrementing its entry count.
    • If another thread already owns the monitor associated with objectref, the thread blocks until the monitor's entry count is zero, then tries again to gain ownership.

  • monitorexit
    The thread that executes monitorexit must be the owner of the monitor associated with the instance referenced by objectref.
    The thread decrements the entry count of the monitor associated with objectref. If as a result the value of the entry count is zero, the thread exits the monitor and is no longer its owner. Other threads that are blocking to enter the monitor are allowed to attempt to do so.

加了 synchronized 關鍵字的方法,生成的字節碼文件中會多一個 ACC_SYNCHRONIZED 標誌位,當方法調用時,調用指令將會檢查方法的 ACC_SYNCHRONIZED 訪問標誌是否被設置,如果設置了,執行線程將先獲取monitor,獲取成功之後才能執行方法體,方法執行完後再釋放monitor。在方法執行期間,其他任何線程都無法再獲得同一個monitor對象。 其實本質上沒有區別,只是方法的同步是一種隱式的方式來實現,無需通過字節碼來完成。

6.3 關於使用

  • 修飾普通方法
    同步對象是實例對象

  • 修飾靜態方法
    同步對象是類本身

  • 修飾代碼塊
    可以自己設置同步對象

6.4 缺點

會讓沒有得到鎖的資源進入Block狀態,爭奪到資源之後又轉爲Running狀態,這個過程涉及到操作系統用戶模式和內核模式的切換,代價比較高。Java1.6爲 synchronized 做了優化,增加了從偏向鎖到輕量級鎖再到重量級鎖的過度,但是在最終轉變爲重量級鎖之後,性能仍然較低。

7. CAS

AtomicBoolean,AtomicInteger,AtomicLong以及 Lock 相關類等底層就是用 CAS實現的,在一定程度上性能比 synchronized 更高。

7.1 什麼是CAS

CAS全稱是Compare And Swap,即比較替換,是實現併發應用到的一種技術。操作包含三個操作數 —— 內存位置(V)、預期原值(A)和新值(B)。 如果內存位置的值與預期原值相匹配,那麼處理器會自動將該位置值更新爲新值 。否則,處理器不做任何操作。

7.2 爲什麼會有CAS

如果只是用 synchronized 來保證同步會存在以下問題
synchronized 是一種悲觀鎖,在使用上會造成一定的性能問題。在多線程競爭下,加鎖、釋放鎖會導致比較多的上下文切換和調度延時,引起性能問題。一個線程持有鎖會導致其它所有需要此鎖的線程掛起。

7.3 實現原理

Java不能直接的訪問操作系統底層,是通過native方法(JNI)來訪問。CAS底層通過Unsafe類實現原子性操作。

7.4 存在的問題

  • ABA問題
    什麼是ABA問題?比如有一個 int 類型的值 N 是 1
    此時有三個線程想要去改變它:
    線程A :希望給 N 賦值爲 2
    線程B: 希望給 N 賦值爲 2
    線程C: 希望給 N 賦值爲 1
    此時線程A和線程B同時獲取到N的值1,線程A率先得到系統資源,將 N 賦值爲 2,線程 B 由於某種原因被阻塞住,線程C在線程A執行完後得到 N 的當前值2
    此時的線程狀態
    線程A成功給 N 賦值爲2
    線程B獲取到 N 的當前值 1 希望給他賦值爲 2,處於阻塞狀態
    線程C獲取當好 N 的當前值 2 希望給他賦值爲1

    然後線程C成功給N賦值爲1
    最後線程B得到了系統資源,又重新恢復了運行狀態,在阻塞之前線程B獲取到的N的值是1,執行compare操作發現當前N的值與獲取到的值相同(均爲1),成功將N賦值爲了2。

    在這個過程中線程B獲取到N的值是一箇舊值,雖然和當前N的值相等,但是實際上N的值已經經歷了一次 1到2到1的改變
    上面這個例子就是典型的ABA問題
    怎樣去解決ABA問題
    給變量加一個版本號即可,在比較的時候不僅要比較當前變量的值 還需要比較當前變量的版本號。Java中AtomicStampedReference 就解決了這個問題

  • 循環時間長開銷大
    在併發量比較高的情況下,如果許多線程反覆嘗試更新某一個變量,卻又一直更新不成功,循環往復,會給CPU帶來很大的壓力。

CAS只能保證一個共享變量的原子操作

8. AbstractQueuedSynchronizer(AQS)

AQS抽象的隊列式同步器,是一種基於狀態(state)的鏈表管理方式。state 是用CAS去修改的。它是 java.util.concurrent 包中最重要的基石,要學習想學習 java.util.concurrent 包裏的內容這個類是關鍵。 ReentrantLock、CountDownLatcher、Semaphore 實現的原理就是基於AQS。想知道他怎麼實現以及實現原理 可以參看這篇文章https://www.cnblogs.com/waterystone/p/4920797.html

9. Future

在併發編程我們一般使用Runable去執行異步任務,然而這樣做我們是不能拿到異步任務的返回值的,但是使用Future 就可以。使用Future很簡單,只需把Runable換成FutureTask即可。使用上比較簡單,這裏不多做介紹。

10. 線程池

如果我們使用線程的時候就去創建一個線程,雖然簡單,但是存在很大的問題。如果併發的線程數量很多,並且每個線程都是執行一個時間很短的任務就結束了,這樣頻繁創建線程就會大大降低系統的效率,因爲頻繁創建線程和銷燬線程需要時間。線程池通過複用可以大大減少線程頻繁創建與銷燬帶來的性能上的損耗。

Java中線程池的實現類 ThreadPoolExecutor,其構造函數的每一個參數的含義在註釋上已經寫得很清楚了,這裏幾個關鍵參數可以再簡單說一下

  • corePoolSize :核心線程數即一直保留在線程池中的線程數量,即使處於閒置狀態也不會被銷燬。要設置 allowCoreThreadTimeOut 爲 true,纔會被銷燬。

  • maximumPoolSize:線程池中允許存在的最大線程數

  • keepAliveTime :非核心線程允許的最大閒置時間,超過這個時間就會本地銷燬。

  • workQueue:用來存放任務的隊列。

    • SynchronousQueue:這個隊列會讓新添加的任務立即得到執行,如果線程池中所有的線程都在執行,那麼就會去創建一個新的線程去執行這個任務。當使用這個隊列的時候,maximumPoolSizes一般都會設置一個最大值 Integer.MAX_VALUE

    • LinkedBlockingQueue:這個隊列是一個×××隊列。怎麼理解呢,就是有多少任務來我們就會執行多少任務,如果線程池中的線程小於corePoolSize ,我們就會創建一個新的線程去執行這個任務,如果線程池中的線程數等於corePoolSize,就會將任務放入隊列中等待,由於隊列大小沒有限制所以也被稱爲×××隊列。當使用這個隊列的時候 maximumPoolSizes 不生效(線程池中線程的數量不會超過corePoolSize),所以一般都會設置爲0。

    • ArrayBlockingQueue:這個隊列是一個有界隊列。可以設置隊列的最大容量。當線程池中線程數大於或者等於 maximumPoolSizes 的時候,就會把任務放到這個隊列中,噹噹前隊列中的任務大於隊列的最大容量就會丟棄掉該任務交由 RejectedExecutionHandler 處理。

最後,本文主要對Java併發編程開發需要的知識點作了簡單的講解,這裏每一個知識點都可以用一篇文章去講解,由於篇幅原因不能對每一個知識點都詳細介紹,我相信通過本文你會對Java的併發編程會有更近一步的瞭解。如果您發現還有缺漏或者有錯誤的地方,可以在評論區補充,謝謝。

微信公衆號【Java技術江湖】一位阿里 Java 工程師的技術小站。(關注公衆號後回覆”Java“即可領取 Java基礎、進階、項目和架構師等免費學習資料,更有數據庫、分佈式、微服務等熱門技術學習視頻,內容豐富,兼顧原理和實踐,另外也將贈送作者原創的Java學習指南、Java程序員面試指南等乾貨資源)



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章