Java多線程參考手冊

本文轉載自ring0hx的博客:

http://blog.csdn.net/ring0hx/article/details/6858582

雖然不夠深入,但是很全面

1         同步

                如何同步多個線程對共享資源的訪問是多線程編程中最基本的問題之一。當多個線程併發訪問共享數據時會出現數據處於計算中間狀態或者不一致的問題,從而影響 到程序的正確運行。我們通常把這種情況叫做競爭條件(race condition),把併發訪問共享數據的代碼叫做關鍵區域(critical section)。同步就是使得多個線程順序進入關鍵區域從而避免競爭條件的發生。

1.1       Synchronized關鍵字

Synchronized是Java多線程編程中最常用的關鍵字。所有的Java 對象都有自己唯一的隱式同步鎖。該鎖只能同時被一個線程獲得,其他試圖獲得該鎖的線程都會被阻塞在對象的等待隊列中直到獲得該鎖的線程釋放鎖才能繼續工 作。Synchronized關鍵字通常有兩種用法。當Synchronized關鍵字用於類方法定義中時,表示所有調用該方法的線程都必須獲得當前對象 的鎖。這種方式比較簡單,但是同步的粒度比較大,當一個線程要執行某個對象的同步方法的時候,必須同時沒有任何其他線程在執行該對象的任一同步方法。此 外,同步方法中的所有代碼均在同步塊中,獲得鎖的線程必須在執行完所有的代碼離開該方法後纔會釋放鎖,這些代碼中可能只有一部分涉及到對共享資源(例如成 員變量)的訪問需要同步,其餘則不需要,那麼這樣粗粒度的同步顯然增加了其他線程的等待時間。Synchronized的另一種 用法允許作用在某個對象上,並且只同步一段代碼而不是整個方法。

 

synchronized (object)  {

 // 需要同步的代碼

}

 

這裏synchronized所作用的對象可以是類的某個成員變量,也可以是這個類對象(用this表示)。這種用法使得程序員可以根據需要同步不同的成員變量,而不總是當前類對象,提高了靈活性。

 值得一提的是,並不是只有對象纔有鎖,類本身也有自己的鎖,這使得static方法同樣可以用synchronized來修飾。訪問同步static方法的線程需要獲得類的同步鎖才能繼續執行。

1.2       Volatile關鍵字

                在Java內存模型中每個線程擁有自己的本地存儲(例如寄存器),並且允許線程擁有變量值的拷貝。這使得本來不需要同步的一些原子操作,例如 boolean成員變量存儲和讀取也變得不安全。設想我們有個叫做done的boolean成員變量和一個當done爲true時纔會停止的循環,該循環 由後臺線程執行,另一個UI線程等待用戶輸入,用戶按下某個按鈕以後會把done設成true從而終止循環。由於UI線程自己本地擁有done的拷貝,用 戶在按下按鈕時只是把自己本地的done設成了true而沒有及時更新主內存中的done,所以後臺線程由於看不到done的改變而不會終止。即使主內存 中的done變化了,後臺線程也會因爲自己本地的變量值沒有及時更新而沒有察覺到done的變化。解決這一問題的方法之一是爲done提供 synchronized的setter和getter方法,這是因爲獲得同步鎖會迫使所有變量的值從臨時存儲(寄存器)寫會主內存。除此之外,Java 提供了一個解決這個問題更爲優雅的方法:Volatile關鍵字。每次使用volatile變量,JVM都會保證從主內存中讀取它的值;同樣每次修改 volatile變量,JVM都會把值寫回到主內存中。

                Volatile適用的場景比較嚴格,必須很清楚地看到volatile只是告訴JVM對於該變量的讀寫必須每次都在主內存中進行而禁止使用臨時的拷貝來 優化,它只是出於JVM特殊的內存模型的需要,並沒有同步的功能。因此只有對volatile變量進行的原子操作(讀取和賦值)纔是線程安全的,像自 增++自減--這樣包含多個命令的操作仍然需要其它的同步措施。

                另一個需要注意的的地方是當用volatile修飾數組的時候,它只是說數組的引用是volatile的,而數組中的元素還是和普通變量一樣,可能被 JVM優化,我們無法爲數組中的元素加上volatile修飾。解決上述問題的方法是使用Atomic變量。作爲使用volatile修飾數組的一個例 子,可以參考java.util.concurrent.CopyOnWriteArrayList。它的add操作是通過複製原來的數組並把新元素添加 到新數組末尾然後再把內部數組引用變量指向新數組來實現的,因此數組變量經常會被修改,需要使用volatile。

1.3       顯式鎖Lock

                儘管synchronized關鍵字可以解決大多數同步問題,J2SE5.0還是引入了Lock接口。相比使用synchronized關鍵字獲取對象隱 式的同步鎖,我們稱Lock爲顯式鎖。使用顯式鎖的一個顯而易見的好處是它不再屬於某個對象,從而可以在多個對象可以共享它。Lock接口有lock() 和unlock()兩個方法,使用它們和使用synchronized關鍵字類似,在進入需要同步的代碼之前調用lock,在離開同步代碼塊時調用 unlock。通常unlock會被放在finally中以保證即使同步代碼塊中有異常發生,鎖仍然可以被釋放。

                和使用synchronized關鍵字和lock()方法總是把未能獲得鎖的線程阻塞不同,Lock接口還提供了非阻塞的tryLock()方法。調用 tryLock方法的線程如果未能獲得鎖會立刻返回false,線程可以繼續執行其他代碼而避免等待,這爲程序員提供了更多自由。

                Lock接口還提供了一個newCondition () 方法,它返回一個Condition對象。Condition對象的作用和Object用於線程通知的wait-notify機制相同。

1.4       信號量Semaphore

                有時候我們有多個相同的共享資源可以同時被多個線程使用。我們希望在鎖的基礎上加上一個計數器,根據資源的個數來初始化這個計數器,每次成功的lock操 作都會使計數器的值減去1,只要計數器的值不爲零就表示還有資源可以使用,lock操作就能成功。每次unlock操作都會給這個計數器加1。只有當計數 器的值爲0的時候lock操作纔會阻塞當前線程。這就是Java中的信號量Semaphore。

                Semaphore類提供的方法和Lock接口非常類似,當把信號量的資源個數設置成1時,信號量就退化爲普通的鎖。

1.5       讀寫鎖ReadWriteLock

                對共享資源的訪問通常可以分爲讀取和寫入。在有些應用場景中讀取可能需要花費較長時間,我們需要使用互斥鎖來阻止併發的寫入操作以保證數據的一致性。但是 對於併發的讀取線程其實並不需要使用同步。事實上只有使數據發生變化的操作才需要同步,我們希望有一種方法可以把讀取和寫入區分開來,讀取和寫入的操作之 間是互斥的,但是多個讀取操作可以同時進行,這樣可以有效提高讀取密集型程序的性能。J2SE5.0提供了ReadWriteLock接口並提供了實現該 接口的ReentrantReadWriteLock類:

 

public interface ReadWriteLock {

    Lock readLock();

    Lock writeLock();

}

 

從接口方法中不難看出讀寫鎖中包含讀鎖和寫鎖。實現類ReentrantReadWriteLock爲我們提供了更多便捷的方法來使用讀寫鎖,例如isWriteLocked可以用來檢測是否被寫鎖定。

 

2         線程通知

                除了同步鎖,Java Object還有兩個可用於線程間通知的同步方法wait和notify。調用對象wait方法的線程會被阻塞在該對象的等待隊列中直到其他線程調用 notify方法來喚醒它。每次notify調用只能喚醒一個在等待隊列中的線程,notifyAll方法可以喚醒所有在該對象等待隊列中的線程。

 

3         最小化同步

                線程同步通過讓線程順序進入同步代碼塊解決了多個線程競爭同一資源而引起的不確定性,但是犧牲了效率,因此爲了取得更好地性能,我們需要儘可能少地使用同 步。事實上並不是所有的競爭條件都是需要避免的,只有當競爭條件出現在非線程安全的代碼段時纔會引起問題。

3.1       Atomic 變量

           如果一個操作是原子操作,例如給一個boolean 變量賦值,我們就不需要同步。Java提供了一些Atomic類,使得一些本來不是原子操作(例如自增操作 ++,它包含了取值、加1、賦值三個原子操作)也能夠原子執行,從而不需要使用同步。

                Java提供了4個基本的原子類,AtomicInteger, AtomicLong, AtomicBoolean和AtomicReference分別提供針對int,long,boolean,object的原子操作。有意思的是如果你 打開JDK的源代碼想看看這些原子操作是如何實現的,你會失望地發現代碼裏面沒有使用任何同步或其它技術。如果你在自己的程序中寫下同樣地代碼,那麼它們 並不是原子的。

3.2       Thread Local 變量

                如果每個線程都有自己私有的成員變量,那麼我們也不需要同步。ThreadLocal就是線程的私有變量,每個使用ThreadLocal變量的線程都會 有自己獨立的ThreadLocal對象,因此就不存在多個線程訪問同一個變量的問題。當然由於ThreadLocal變量爲線程私有,它也就不可以用於 在多個線程間共享狀態。

                ThreadLocal類並不神祕,它的實現原理比較簡單:每個Thread對象有自己用來存儲私有ThreadLocal對象的容器 ThreadLocalMap,當某個線程調用ThreadLocal對象的get()方法來 取值的時候,get方法首先會取得當前線程對象,然後取出該線程的ThreadLocalMap,然後檢查自己是否已經在map中,如果自己已經存在,直 接返回map中的value。如果不存在,把自己作key並初始化一個value加入到當前線程的map中。

 

    public T get() {

        Thread t = Thread.currentThread ();

        ThreadLocalMap map = getMap(t);

        if (map != null ) {

            ThreadLocalMap.Entry e = map.getEntry(this );

            if (e != null )

                return (T)e.value;

        }

        return setInitialValue();

}

 

4         線程池Thread Pool

                線程雖然不像進程需要那麼多資源,但是它的創建也是有一定開銷的,頻繁地創建和銷燬線程會降低程序的性能;此外應用程序可以創建線程的數量是受機器物理條 件制約的,過多的線程會耗盡機器的資源,因此我們在設計程序的時候需要限制併發線程的數量。解決這兩個問題的通常做法是使用線程池。線程池在啓動的時候一 次性初始化若干個線程(也可以根據負載按需啓動,也有閒置一定時間的線程會被銷燬的策略),然後程序把任務交給線程池去執行而不是直接交給某個線程執行, 由線程池給這些任務分配線程。當某個線程執行完一個任務後,線程池會把它設成空閒狀態以備下一個任務重用而不是銷燬它。線程池在初始化的時候需要指定線程 數量上限,當併發任務數量超過線程數量的時候,線程池不會再創建新的線程而是讓新任務等待,這樣我們就不在需要擔心線程數量過多耗盡系統資源了。 JDK1.5開始爲我們提供了標準的線程池。

4.1       執行器Executor

                Java的線程池實現了以下Executor接口:

 

public interface Executor {

    void execute(Runnable command);

}

 

                在多線程編程中,執行器是一種常用的設計模式,它的好處在於提供了一種簡單有效的編程模型,我們只需把需要併發處理的工作拆分成獨立的任務,然後交給執行 器去執行即可而不必關心線程的創建,分配和調度。J2SE5.0主要提供了兩種功能的執行器:ThreadPoolExecutor和 ScheduledThreadPoolExecutor。ThreadPoolExecutor是基本的線程池實 現,ScheduledThreadPoolExecutor在前者基礎上增加了任務調度的功能,在把任務交給它時我們可以指定任務的執行時間,而不是立 刻執行。

                java.util.concurrent.Executors是用來創建線程池的工廠類,通過它提供的工廠方法,我們可以方便地創建不同特性的線程池。

4.2       Future接口

                Executor接口並沒有看起來那麼理想,有時候我們執行一個任務是要得到計算的結果,有時候我們需要對任務有更多控制,例如知道它是否完成,或者中途 終止它。返回void的execute方法並不能滿足我們這些需求。當然我們可以在傳入的Runnable類上下功夫來提供類似的功能,但是這樣做繁瑣且 容易出錯。既然J2SE爲我們提供了線程池的標準實現把我們從多線程編程中解放出來,這些常見的需求當然也會很好地滿足。事實上線程池實現了一個更爲豐富 的ExecutorService接口,它定義了執行任務並返回代表該任務的Future對象的submit方法。

           通過Future接口,我們可以查看已經被提交給線程池執行的任務是否完成,獲取執行的結果或者終止任務。

4.3       Runnable 和Callable 接口

                實現了Runnable或Callable接口的類都可以作爲任務提交給線程池執行,這兩個接口的主要區別在於Callable的call方法有結果返回 並且可以拋出異常而Runnable的run方法返回void且不允許有可檢查的異常拋出(只能拋runtime exception)。因此如果我們的任務執行後有結果返回,應該使用Callable接口。

 

5         線程和集合類

5.1       線程安全的集合類

·         java.util.Vector

·         java.util.Stack

·         java.util.HashTable

·         java.util.concurrent.ConcurrentHashMap

·         java.util.concurrent.CopyOnWriteArrayList

·         java.util.concurrent.CopyOnWriteArraySet

·         java.util.concurrent.ConcurrentLinkedQueue

5.2       非線程安全集合類

·         java.util.BitSet

·         java.util.HashSet (LinkedHashSet)

·         java.util.TreeSet

·         java.util.HashMap (WeekHashMap, TreeMap, LinkedHashMap, IdentityHashMap)

·         java.util.ArrayList (LinkedList)

·         java.util.PriorityQueue

                這些非線程安全的集合可以通過java.util.Collections.SynchronizedList、SynchronizedMap、 SynchronizedSet等方法包裝成線程安全的集合。包裝器類簡單地給被包裝集合的各項操作加上了synchronized保護。值得注意的是在 使用遊標遍歷這些包裝器集合的時候必須加上額外的synchronized保護,否則會出現問題。

     List list = Collections.synchronizedList(new ArrayList());

         ...

     synchronized(list) {

         Iterator i = list.iterator(); // Must be in synchronized block

         while (i.hasNext())

             foo(i.next());

     }

5.3       線程通知集合類

·         java.util.concurrent.ArrayBlockingQueue

·         java.util.concurrent.LinkedBlockingQueue

·         java.util.concurrent.SynchronousQueue

·         java.util.concurrent.PriorityBlockingQueue

·         java.util.concurrent.DelayQueue

                這些集合類都實現了BlockingQueue接口。阻塞隊列的特點是當從隊列中取出元素時如果隊列爲空,線程會被阻塞直到隊列中有元素被插入。當從隊列 中插入元素時如果隊列已滿,線程會被阻塞直到隊列中有元素被取出出現空閒空間。阻塞隊列可以用來實現生產者消費者模式 (Producer/Consumer Pattern) 。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章