關於ThreadLocal

 ThreadLocal是什麼?

  ThreadLocal是什麼呢?其實ThreadLocal並非是一個線程的本地實現版本,它並不是一個Thread,而是thread local variable(線程局部變量)。也許把它命名爲ThreadLocalVar更加合適。線程局部變量(ThreadLocal)其實的功用非常簡單,就是爲每一個使用該變量的線程都提供一個變量值的副本,是每一個線程都可以獨立地改變自己的副本,而不會和其它線程的副本衝突。從線程的角度看,就好像每一個線程都完全擁有該變量。線程局部變量並不是Java的新發明,在其它的一些語言編譯器實現(如IBM XL FORTRAN)中,它在語言的層次提供了直接的支持。因爲Java中沒有提供在語言層次的直接支持,而是提供了一個ThreadLocal的類來提供支持,所以,在Java中編寫線程局部變量的代碼相對比較笨拙,這也許是線程局部變量沒有在Java中得到很好的普及的一個原因吧。

ThreadLocal 類是悄悄地出現在 Java 平臺版本 1.2 中的。雖然支持線程局部變量早就是許多線程工具(例如 Posix pthreads 工具)的一部分,但 Java Threads API 的最初設計卻沒有這項有用的功能。而且,最初的實現也相當低效。由於這些原因, ThreadLocal 極少受到關注,但對簡化線程安全併發程序的開發來說,它卻是很方便的。在 輕鬆使用線程的第 3 部分,Java 軟件顧問 Brian Goetz 研究了 ThreadLocal 並提供了一些使用技巧。

編寫線程安全類是困難的。它不但要求仔細分析在什麼條件可以對變量進行讀寫,而且要求仔細分析其它類能如何使用某個類。 有時,要在不影響類的功能、易用性或性能的情況下使類成爲線程安全的是很困難的。有些類保留從一個方法調用到下一個方法調用的狀態信息,要在實踐中使這樣的類成爲線程安全的是困難的。

管理非線程安全類的使用比試圖使類成爲線程安全的要更容易些。非線程安全類通常可以安全地在多線程程序中使用,只要您能確保一個線程所用的類的實例不被其它線程使用。例如,JDBC Connection 類是非線程安全的 — 兩個線程不能在小粒度級上安全地共享一個 Connection — 但如果每個線程都有它自己的 Connection ,那麼多個線程就可以同時安全地進行數據庫操作。

不使用 ThreadLocal 爲每個線程維護一個單獨的 JDBC 連接(或任何其它對象)當然是可能的;Thread API 給了我們把對象和線程聯繫起來所需的所有工具。而 ThreadLocal 則使我們能更容易地把線程和它的每線程(per-thread)數據成功地聯繫起來。

 

什麼是線程局部變量(thread-local variable)?

線程局部變量高效地爲每個使用它的線程提供單獨的線程局部變量值的副本。每個線程只能看到與自己相聯繫的值,而不知道別的線程可能正在使用或修改它們自己的副本。一些編譯器(例如 Microsoft Visual C++ 編譯器或 IBM XL FORTRAN 編譯器)用存儲類別修飾符(像 staticvolatile )把對線程局部變量的支持集成到了其語言中。Java 編譯器對線程局部變量不提供特別的語言支持;相反地,它用 ThreadLocal 類實現這些支持, 核心 Thread 類中有這個類的特別支持。

因爲線程局部變量是通過一個類來實現的,而不是作爲 Java 語言本身的一部分,所以 Java 語言線程局部變量的使用語法比內建線程局部變量語言的使用語法要笨拙一些。要創建一個線程局部變量,請實例化類 ThreadLocal 的一個對象。 ThreadLocal 類的行爲與 java.lang.ref 中的各種 Reference 類的行爲很相似; ThreadLocal 類充當存儲或檢索一個值時的間接句柄。清單 1 顯示了 ThreadLocal 接口。


清單 1. ThreadLocal 接口

get() 訪問器檢索變量的當前線程的值; set() 訪問器修改當前線程的值。 initialValue() 方法是可選的,如果線程未使用過某個變量,那麼您可以用這個方法來設置這個變量的初始值;它允許延遲初始化。用一個示例實現來說明 ThreadLocal 的工作方式是最好的方法。清單 2 顯示了 ThreadLocal 的一個實現方式。它不是一個特別好的實現(雖然它與最初實現非常相似),所以很可能性能不佳,但它清楚地說明了 ThreadLocal 的工作方式。

 

清單 2. ThreadLocal 的糟糕實現

這個實現的性能不會很好,因爲每個 get()set() 操作都需要 values 映射表上的同步,而且如果多個線程同時訪問同一個 ThreadLocal ,那麼將發生爭用。此外,這個實現也是不切實際的,因爲用 Thread 對象做 values 映射表中的關鍵字將導致無法在線程退出後對 Thread 進行垃圾回收,而且也無法對死線程的 ThreadLocal 的特定於線程的值進行垃圾回收。

 

用 ThreadLocal 實現每線程 Singleton

線程局部變量常被用來描繪有狀態“單子”(Singleton) 或線程安全的共享對象,或者是通過把不安全的整個變量封裝進 ThreadLocal ,或者是通過把對象的特定於線程的狀態封裝進 ThreadLocal 。例如,在與數據庫有緊密聯繫的應用程序中,程序的很多方法可能都需要訪問數據庫。在系統的每個方法中都包含一個 Connection 作爲參數是不方便的 — 用“單子”來訪問連接可能是一個雖然更粗糙,但卻方便得多的技術。然而,多個線程不能安全地共享一個 JDBC Connection 。如清單 3 所示,通過使用“單子”中的 ThreadLocal ,我們就能讓我們的程序中的任何類容易地獲取每線程 Connection 的一個引用。這樣,我們可以認爲 ThreadLocal 允許我們創建 每線程單子


清單 3. 把一個 JDBC 連接存儲到一個每線程 Singleton 中

 

任何創建的花費比使用的花費相對昂貴些的有狀態或非線程安全的對象,例如 JDBC Connection 或正則表達式匹配器,都是可以使用每線程單子(singleton)技術的好地方。當然,在類似這樣的地方,您可以使用其它技術,例如用池,來安全地管理共享訪問。然而,從可伸縮性角度看,即使是用池也存在一些潛在缺陷。因爲池實現必須使用同步,以維護池數據結構的完整性,如果所有線程使用同一個池,那麼在有很多線程頻繁地對池進行訪問的系統中,程序性能將因爭用而降低。

ThreadLocal 的性能

雖然線程局部變量早已赫赫有名並被包括 Posix pthreads 規範在內的很多線程框架支持,但最初的 Java 線程設計中卻省略了它,只是在 Java 平臺的版本 1.2 中才添加上去。在很多方面, ThreadLocal 仍在發展之中;在版本 1.3 中它被重寫,版本 1.4 中又重寫了一次,兩次都專門是爲了性能問題。

在 JDK 1.2 中, ThreadLocal 的實現方式與清單 2 中的方式非常相似,除了用同步 WeakHashMap 代替 HashMap 來存儲 values 之外。(以一些額外的性能開銷爲代價,使用 WeakHashMap 解決了無法對 Thread 對象進行垃圾回收的問題。)不用說, ThreadLocal 的性能是相當差的。

Java 平臺版本 1.3 提供的 ThreadLocal 版本已經儘量更好了;它不使用任何同步,從而不存在可伸縮性問題,而且它也不使用弱引用。相反地,人們通過給 Thread 添加一個實例變量(該變量用於保存當前線程的從線程局部變量到它的值的映射的 HashMap )來修改 Thread 類以支持 ThreadLocal 。因爲檢索或設置一個線程局部變量的過程不涉及對可能被另一個線程讀寫的數據的讀寫操作,所以您可以不用任何同步就實現 ThreadLocal.get()set() 。而且,因爲每線程值的引用被存儲在自已的 Thread 對象中,所以當對 Thread 進行垃圾回收時,也能對該 Thread 的每線程值進行垃圾回收。

不幸的是,即使有了這些改進,Java 1.3 中的 ThreadLocal 的性能仍然出奇地慢。據我的粗略測量,在雙處理器 Linux 系統上的 Sun 1.3 JDK 中進行 ThreadLocal.get() 操作,所耗費的時間大約是無爭用同步的兩倍。性能這麼差的原因是 Thread.currentThread() 方法的花費非常大,佔了 ThreadLocal.get() 運行時間的三分之二還多。雖然有這些缺點,JDK 1.3 ThreadLocal.get() 仍然比爭用同步快得多,所以如果在任何存在嚴重爭用的地方(可能是有非常多的線程,或者同步塊被頻繁地執行,或者同步塊很大), ThreadLocal 可能仍然要高效得多。

在 Java 平臺的最新版本,即版本 1.4b2 中, ThreadLocalThread.currentThread() 的性能都有了很大提高。有了這些提高, ThreadLocal 應該比其它技術,如用池,更快。由於它比其它技術更簡單,也更不易出錯,人們最終將發現它是避免線程間出現不希望的交互的有效途徑。

ThreadLocal 的好處

ThreadLocal 能帶來很多好處。它常常是把有狀態類描繪成線程安全的,或者封裝非線程安全類以使它們能夠在多線程環境中安全地使用的最容易的方式。使用 ThreadLocal 使我們可以繞過爲實現線程安全而對何時需要同步進行判斷的複雜過程,而且因爲它不需要任何同步,所以也改善了可伸縮性。除簡單之外,用 ThreadLocal 存儲每線程單子或每線程上下文信息在歸檔方面還有一個頗有價值好處 — 通過使用 ThreadLocal ,存儲在 ThreadLocal 中的對象都是 被線程共享的是清晰的,從而簡化了判斷一個類是否線程安全的工作。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章