Java源碼裏面都有大量的註釋,認真讀懂這些註釋,就可以把握其七分工作機制了。關於ThreadPoolExecutor的解析,我們就從其類註釋開始。
現將註釋大致翻譯如下:
ExecutorService(ThreadPoolExecutor的頂層接口)使用線程池中的線程執行每個提交的任務,通常我們使用Executors的工廠方法來創建ExecutorService。
線程池解決了兩個不同的問題:
- 提升性能:它們通常在執行大量異步任務時,由於減少了每個任務的調用開銷,並且它們提供了一種限制和管理資源(包括線程)的方法,使得性能提升明顯;
- 統計信息:每個ThreadPoolExecutor保持一些基本的統計信息,例如完成的任務數量。
爲了在廣泛的上下文中有用,此類提供了許多可調參數和可擴展性鉤子。 但是,在常見場景中,我們預配置了幾種線程池,我們敦促程序員使用更方便的Executors的工廠方法直接使用。
- Executors.newCachedThreadPool(無界線程池,自動線程回收)
- Executors.newFixedThreadPool(固定大小的線程池);
- Executors.newSingleThreadExecutor(單一後臺線程);
注:這裏沒有提到ScheduledExecutorService ,後續解析。
在自定義線程池時,請參考以下指南:
一、Core and maximum pool sizes 核心和最大線程池數量
參數 | 翻譯 |
---|---|
corePoolSize | 核心線程池數量 |
maximumPoolSize | 最大線程池數量 |
線程池執行器將會根據corePoolSize和maximumPoolSize自動地調整線程池大小。
當在execute(Runnable)方法中提交新任務並且少於corePoolSize線程正在運行時,即使其他工作線程處於空閒狀態,也會創建一個新線程來處理該請求。 如果有多於corePoolSize但小於maximumPoolSize線程正在運行,則僅當隊列已滿時纔會創建新線程。 通過設置corePoolSize和maximumPoolSize相同,您可以創建一個固定大小的線程池。 通過將maximumPoolSize設置爲基本上無界的值,例如Integer.MAX_VALUE,您可以允許池容納任意數量的併發任務。 通常,核心和最大池大小僅在構建時設置,但也可以使用setCorePoolSize
和setMaximumPoolSize
進行動態更改。
這段話詳細了描述了線程池對任務的處理流程,這裏用個圖總結一下
線程任務處理流程.png
二、prestartCoreThread 核心線程預啓動
在默認情況下,只有當新任務到達時,纔開始創建和啓動核心線程,但是我們可以使用 prestartCoreThread()
和 prestartAllCoreThreads()
方法動態調整。
如果使用非空隊列構建池,則可能需要預先啓動線程。
方法 | 作用 |
---|---|
prestartCoreThread() | 創一個空閒任務線程等待任務的到達 |
prestartAllCoreThreads() | 創建核心線程池數量的空閒任務線程等待任務的到達 |
三、ThreadFactory 線程工廠
新線程使用ThreadFactory創建。 如果未另行指定,則使用Executors.defaultThreadFactory默認工廠,使其全部位於同一個ThreadGroup中,並且具有相同的NORM_PRIORITY優先級和非守護進程狀態。
通過提供不同的ThreadFactory,您可以更改線程的名稱,線程組,優先級,守護進程狀態等。如果ThreadCactory在通過從newThread返回null詢問時未能創建線程,則執行程序將繼續,但可能無法執行任何任務。
線程應該有modifyThread權限。 如果工作線程或使用該池的其他線程不具備此權限,則服務可能會降級:配置更改可能無法及時生效,並且關閉池可能會保持可終止但尚未完成的狀態。
四、Keep-alive times 線程存活時間
如果線程池當前擁有超過corePoolSize的線程,那麼多餘的線程在空閒時間超過keepAliveTime時會被終止 ( 請參閱getKeepAliveTime(TimeUnit) )。這提供了一種在不積極使用線程池時減少資源消耗的方法。
如果池在以後變得更加活躍,則應構建新線程。 也可以使用方法setKeepAliveTime(long,TimeUnit)
進行動態調整。
防止空閒線程在關閉之前終止,可以使用如下方法:
setKeepAliveTime(Long.MAX_VALUE,TimeUnit.NANOSECONDS);
默認情況下,keep-alive策略僅適用於存在超過corePoolSize線程的情況。 但是,只要keepAliveTime值不爲零,方法allowCoreThreadTimeOut(boolean)
也可用於將此超時策略應用於核心線程。
五、Queuing 隊列
BlockingQueu用於存放提交的任務,隊列的實際容量與線程池大小相關聯。
-
如果當前線程池任務線程數量小於核心線程池數量,執行器總是優先創建一個任務線程,而不是從線程隊列中取一個空閒線程。
-
如果當前線程池任務線程數量大於核心線程池數量,執行器總是優先從線程隊列中取一個空閒線程,而不是創建一個任務線程。
-
如果當前線程池任務線程數量大於核心線程池數量,且隊列中無空閒任務線程,將會創建一個任務線程,直到超出maximumPoolSize,如果超時maximumPoolSize,則任務將會被拒絕。
這個過程參考[線程任務處理流程圖.png]
主要有三種隊列策略:
-
Direct handoffs 直接握手隊列
Direct handoffs 的一個很好的默認選擇是 SynchronousQueue,它將任務交給線程而不需要保留。這裏,如果沒有線程立即可用來運行它,那麼排隊任務的嘗試將失敗,因此將構建新的線程。
此策略在處理可能具有內部依賴關係的請求集時避免鎖定。Direct handoffs 通常需要無限制的maximumPoolSizes來避免拒絕新提交的任務。 但得注意,當任務持續以平均提交速度大餘平均處理速度時,會導致線程數量會無限增長問題。 -
Unbounded queues 無界隊列
當所有corePoolSize線程繁忙時,使用無界隊列(例如,沒有預定義容量的LinkedBlockingQueue)將導致新任務在隊列中等待,從而導致maximumPoolSize的值沒有任何作用。當每個任務互不影響,完全獨立於其他任務時,這可能是合適的; 例如,在網頁服務器中, 這種隊列方式可以用於平滑瞬時大量請求。但得注意,當任務持續以平均提交速度大餘平均處理速度時,會導致隊列無限增長問題。 -
Bounded queues 有界隊列
一個有界的隊列(例如,一個ArrayBlockingQueue)和有限的maximumPoolSizes配置有助於防止資源耗盡,但是難以控制。隊列大小和maximumPoolSizes需要 相互權衡:
- 使用大隊列和較小的maximumPoolSizes可以最大限度地減少CPU使用率,操作系統資源和上下文切換開銷,但會導致人爲的低吞吐量。如果任務經常被阻塞(比如I/O限制),那麼系統可以調度比我們允許的更多的線程。
- 使用小隊列通常需要較大的maximumPoolSizes,這會使CPU更繁忙,但可能會遇到不可接受的調度開銷,這也會降低吞吐量。
這裏主要爲了說明有界隊列大小和maximumPoolSizes的大小控制,若何降低資源消耗的同時,提高吞吐量
六、Rejected tasks 拒絕任務
拒絕任務有兩種情況:1. 線程池已經被關閉;2. 任務隊列已滿且maximumPoolSizes已滿;
無論哪種情況,都會調用RejectedExecutionHandler的rejectedExecution方法。預定義了四種處理策略:
- AbortPolicy:默認測策略,拋出RejectedExecutionException運行時異常;
- CallerRunsPolicy:這提供了一個簡單的反饋控制機制,可以減慢提交新任務的速度;
- DiscardPolicy:直接丟棄新提交的任務;
- DiscardOldestPolicy:如果執行器沒有關閉,隊列頭的任務將會被丟棄,然後執行器重新嘗試執行任務(如果失敗,則重複這一過程);
我們可以自己定義RejectedExecutionHandler,以適應特殊的容量和隊列策略場景中。
七、Hook methods 鉤子方法
ThreadPoolExecutor爲提供了每個任務執行前後提供了鉤子方法,重寫beforeExecute(Thread,Runnable)
和afterExecute(Runnable,Throwable)
方法來操縱執行環境; 例如,重新初始化ThreadLocals,收集統計信息或記錄日誌等。此外,terminated()
在Executor完全終止後需要完成後會被調用,可以重寫此方法,以執行任殊處理。
注意:如果hook或回調方法拋出異常,內部的任務線程將會失敗並結束。
八、Queue maintenance 維護隊列getQueue()
方法可以訪問任務隊列,一般用於監控和調試。絕不建議將這個方法用於其他目的。當在大量的隊列任務被取消時,remove()
和purge()
方法可用於回收空間。
九、Finalization 關閉
如果程序中不在持有線程池的引用,並且線程池中沒有線程時,線程池將會自動關閉。如果您希望確保即使用戶忘記調用 shutdown()
方法也可以回收未引用的線程池,使未使用線程最終死亡。那麼必須通過設置適當的 keep-alive times 並設置allowCoreThreadTimeOut(boolean) 或者 使 corePoolSize下限爲0 。一般情況下,線程池啓動後建議手動調用shutdown()關閉。
總結,通過解讀ThreadPoolExecutor的註釋,我們對ThreadPoolExecutor應該有了比較全面的瞭解,其實現方式,後續章節詳解。