21、Java併發類庫提供的線程池有哪幾種？分別有什麼特點？（高併發編程----7）

我在專欄第 17 講中介紹過線程是不能夠重複啓動的（兩次調用start()），創建或銷燬線程存在一定的開銷，所以利用線程池技術來提高系統資源利用效率，並簡化線程管理，已經是非常成熟的選擇。

今天我要問你的問題是，Java 併發類庫提供的線程池有哪幾種？分別有什麼特點？

典型回答

通常開發者都是利用 Executors 提供的通用線程池創建方法，去創建不同配置的線程池，主要區別在於不同的 ExecutorService 類型或者不同的初始參數。

Executors 目前提供了 5 種不同的線程池創建配置：

newCachedThreadPool()，它是一種用來處理大量短時間工作任務的線程池，具有幾個鮮明特點：它會試圖緩存線程並重用，當無緩存線程可用時，就會創建新的工作線程；如果線程閒置的時間超過60 秒，則被終止並移出緩存；長時間閒置時，這種線程池，不會消耗什麼資源。其內部使用 SynchronousQueue 作爲工作隊列。
newFixedThreadPool(int nThreads)，重用指定數目（nThreads）的線程，其背後使用的是無界的工作隊列，任何時候最多有 nThreads 個工作線程是活動的。這意味着，如果任務數量超過了活動隊列數目，將在工作隊列中等待空閒線程出現；如果有工作線程退出，將會有新的工作線程被創建，以補足指定的數目 nThreads。
newSingleThreadExecutor()，它的特點在於工作線程數目被限制爲 1，操作一個無界的工作隊列，所以它保證了所有任務的都是被順序執行，最多會有一個任務處於活動狀態，並且不允許使用者改動線程池實例，因此可以避免其改變線程數目。
newSingleThreadScheduledExecutor() 和 newScheduledThreadPool(int corePoolSize)，創建的是個 ScheduledThreadPoolExecutor，可以進行定時或週期性的工作調度，區別在於單一工作線程還是多個工作線程。
newWorkStealingPool(int parallelism)，這是一個經常被人忽略的線程池，Java 8 才加入這個創建方法，其內部會構建ForkJoinPool，利用Work-Stealing算法，並行地處理任務，不保證處理順序。

考點分析

Java 併發包中的 Executor 框架無疑是併發編程中的重點，今天的題目考察的是對幾種標準線程池的瞭解，我提供的是一個針對最常見的應用方式的回答。

在大多數應用場景下，使用 Executors 提供的 5 個靜態工廠方法就足夠了，但是仍然可能需要直接利用 ThreadPoolExecutor 等構造函數創建，這就要求你對線程構造方式有進一步的瞭解，你需要明白線程池的設計和結構。

另外，線程池這個定義就是個容易讓人誤解的術語，因爲 ExecutorService 除了通常意義上“池”的功能，還提供了更全面的線程管理、任務提交等方法。

Executor 框架可不僅僅是線程池，我覺得至少下面幾點值得深入學習：

掌握 Executor 框架的主要內容，至少要了解組成與職責，掌握基本開發用例中的使用。
對線程池和相關併發工具類型的理解，甚至是源碼層面的掌握。
實踐中有哪些常見問題，基本的診斷思路是怎樣的。
如何根據自身應用特點合理使用線程池。

知識擴展

首先，我們來看看 Executor 框架的基本組成，請參考下面的類圖。

我們從整體上把握一下各個類型的主要設計目的：

Executor 是一個基礎的接口，其初衷是將任務提交和任務執行細節解耦，這一點可以體會其定義的唯一方法。

void execute(Runnable command);

Executor 的設計是源於 Java 早期線程 API 使用的教訓，開發者在實現應用邏輯時，被太多線程創建、調度等不相關細節所打擾。就像我們進行 HTTP 通信，如果還需要自己操作 TCP 握手，開發效率低下，質量也難以保證。

ExecutorService 則更加完善，不僅提供 service 的管理功能，比如 shutdown 等方法，也提供了更加全面的提交任務機制，如返回Future而不是 void 的 submit 方法。

<T> Future<T> submit(Callable<T> task);

注意，這個例子輸入的可是Callable，它解決了 Runnable 無法返回結果的困擾。

Java 標準類庫提供了幾種基礎實現，比如ThreadPoolExecutor、ScheduledThreadPoolExecutor、ForkJoinPool。這些線程池的設計特點在於其高度的可調節性和靈活性，以儘量滿足複雜多變的實際應用場景，我會進一步分析其構建部分的源碼，剖析這種靈活性的源頭。
Executors 則從簡化使用的角度，爲我們提供了各種方便的靜態工廠方法。

下面我就從源碼角度，分析線程池的設計與實現，我將主要圍繞最基礎的 ThreadPoolExecutor 源碼。

ScheduledThreadPoolExecutor 是 ThreadPoolExecutor 的擴展，主要是增加了調度邏輯，如想深入瞭解，你可以參考相關教程。而 ForkJoinPool 則是爲 ForkJoinTask 定製的線程池，與通常意義的線程池有所不同。

ThreadPoolExecutor 源碼這部分內容比較晦澀，羅列概念也不利於你去理解，所以我會配合一些示意圖來說明。在現實應用中，理解應用與線程池的交互和線程池的內部工作過程，你可以參考下圖。

簡單理解一下：

工作隊列負責存儲用戶提交的各個任務，這個工作隊列，可以是容量爲 0 的 SynchronousQueue（使用 newCachedThreadPool），也可以是像固定大小線程池（newFixedThreadPool）那樣使用 LinkedBlockingQueue。

private final BlockingQueue<Runnable> workQueue;

內部的“線程池”，這是指保持工作線程的集合，線程池需要在運行過程中管理線程創建、銷燬。例如，對於帶緩存的線程池，當任務壓力較大時，線程池會創建新的工作線程；當業務壓力退去，線程池會在閒置一段時間（默認，60 秒）後結束線程。

private final HashSet<Worker> workers = new HashSet<>();

線程池的工作線程被抽象爲靜態內部類 Worker，基於AQS實現。

ThreadFactory 提供上面所需要的創建線程邏輯。
如果任務提交時被拒絕，比如線程池已經處於 SHUTDOWN 狀態，需要爲其提供處理邏輯，Java 標準庫提供了類似ThreadPoolExecutor.AbortPolicy等默認實現，也可以按照實際需求自定義。

從上面的分析，就可以看出線程池的幾個基本組成部分，一起都體現在線程池的構造函數中，從字面我們就可以大概猜測到其用意：

public ThreadPoolExecutor(int corePoolSize,
                          int maximumPoolSize,
                          long keepAliveTime,
                          TimeUnit unit,
                          BlockingQueue<Runnable> workQueue,
                          ThreadFactory threadFactory,
                          RejectedExecutionHandler handler)

corePoolSize，所謂的核心線程數，可以大致理解爲長期駐留的線程數目（除非設置了 allowCoreThreadTimeOut）。對於不同的線程池，這個值可能會有很大區別，比如 newFixedThreadPool 會將其設置爲 nThreads，而對於 newCachedThreadPool 則是爲 0。
maximumPoolSize，顧名思義，就是線程不夠時能夠創建的最大線程數。同樣進行對比，對於 newFixedThreadPool，當然就是 nThreads，因爲其要求是固定大小，而 newCachedThreadPool 則是 Integer.MAX_VALUE。
keepAliveTime 和 TimeUnit，這兩個參數指定了額外的線程能夠閒置多久，顯然有些線程池不需要它。
workQueue，工作隊列，必須是 BlockingQueue。

通過配置不同的參數，我們就可以創建出行爲大相徑庭的線程池，這就是線程池高度靈活性的基礎。

進一步分析，線程池既然有生命週期，它的狀態是如何表徵的呢？

這裏有一個非常有意思的設計，ctl 變量被賦予了雙重角色，通過高低位的不同，既表示線程池狀態，又表示工作線程數目，這是一個典型的高效優化。試想，實際系統中，雖然我們可以指定線程極限爲 Integer.MAX_VALUE，但是因爲資源限制，這只是個理論值，所以完全可以將空閒位賦予其他意義。

private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
// 真正決定了工作線程數的理論上限 
private static final int COUNT_BITS = Integer.SIZE - 3;
private static final int COUNT_MASK = (1 << COUNT_BITS) - 1;
// 線程池狀態，存儲在數字的高位
private static final int RUNNING = -1 << COUNT_BITS;
…
// Packing and unpacking ctl
private static int runStateOf(int c)  { return c & ~COUNT_MASK; }
private static int workerCountOf(int c)  { return c & COUNT_MASK; }
private static int ctlOf(int rs, int wc) { return rs | wc; }

爲了讓你能對線程生命週期有個更加清晰的印象，我這裏畫了一個簡單的狀態流轉圖，對線程池的可能狀態和其內部方法之間進行了對應，如果有不理解的方法，請參考 Javadoc。注意，實際 Java 代碼中並不存在所謂 Idle 狀態，我添加它僅僅是便於理解。

前面都是對線程池屬性和構建等方面的分析，下面我選擇典型的 execute 方法，來看看其是如何工作的，具體邏輯請參考我添加的註釋，配合代碼更加容易理解。

public void execute(Runnable command) {
…
    int c = ctl.get();
    // 檢查工作線程數目，低於 corePoolSize 則添加 Worker
    if (workerCountOf(c) < corePoolSize) {
        if (addWorker(command, true))
            return;
        c = ctl.get();
    }
    // isRunning 就是檢查線程池是否被 shutdown
    // 工作隊列可能是有界的，offer 是比較友好的入隊方式
    if (isRunning(c) && workQueue.offer(command)) {
        int recheck = ctl.get();
        // 再次進行防禦性檢查
        if (! isRunning(recheck) && remove(command))
            reject(command);
        else if (workerCountOf(recheck) == 0)
            addWorker(null, false);
    }
    // 嘗試添加一個 worker，如果失敗以爲着已經飽和或者被 shutdown 了
    else if (!addWorker(command, false))
        reject(command);
}

線程池實踐

線程池雖然爲提供了非常強大、方便的功能，但是也不是銀彈，使用不當同樣會導致問題。我這裏介紹些典型情況，經過前面的分析，很多方面可以自然的推導出來。

避免任務堆積。前面我說過 newFixedThreadPool 是創建指定數目的線程，但是其工作隊列是無界的，如果工作線程數目太少，導致處理跟不上入隊的速度，這就很有可能佔用大量系統內存，甚至是出現 OOM。診斷時，你可以使用 jmap 之類的工具，查看是否有大量的任務對象入隊。
避免過度擴展線程。我們通常在處理大量短時任務時，使用緩存的線程池，比如在最新的 HTTP/2 client API 中，目前的默認實現就是如此。我們在創建線程池的時候，並不能準確預計任務壓力有多大、數據特徵是什麼樣子（大部分請求是 1K 、100K 還是 1M 以上？），所以很難明確設定一個線程數目。
另外，如果線程數目不斷增長（可以使用 jstack 等工具檢查），也需要警惕另外一種可能性，就是線程泄漏，這種情況往往是因爲任務邏輯有問題，導致工作線程遲遲不能被釋放。建議你排查下線程棧，很有可能多個線程都是卡在近似的代碼處。
避免死鎖等同步問題，對於死鎖的場景和排查，你可以複習專欄第 18 講。
儘量避免在使用線程池時操作 ThreadLocal，同樣是專欄第 17 講已經分析過的，通過今天的線程池學習，應該更能理解其原因，工作線程的生命週期通常都會超過任務的生命週期。

線程池大小的選擇策略

上面我已經介紹過，線程池大小不合適，太多會太少，都會導致麻煩，所以我們需要去考慮一個合適的線程池大小。雖然不能完全確定，但是有一些相對普適的規則和思路。

如果我們的任務主要是進行計算，那麼就意味着 CPU 的處理能力是稀缺的資源，我們能夠通過大量增加線程數提高計算能力嗎？往往是不能的，如果線程太多，反倒可能導致大量的上下文切換開銷。所以，這種情況下，通常建議按照 CPU 核的數目 N 或者 N+1。
如果是需要較多等待的任務，例如 I/O 操作比較多，可以參考 Brain Goetz 推薦的計算方法：

線程數 = CPU 核數 × （1 + 平均等待時間 / 平均工作時間）

這些時間並不能精準預計，需要根據採樣或者概要分析等方式進行計算，然後在實際中驗證和調整。

上面是僅僅考慮了 CPU 等限制，實際還可能受各種系統資源限制影響，例如我最近就在 Mac OS X 上遇到了大負載時ephemeral 端口受限的情況。當然，我是通過擴大可用端口範圍解決的，如果我們不能調整資源的容量，那麼就只能限制工作線程的數目了。這裏的資源可以是文件句柄、內存等。

另外，在實際工作中，不要把解決問題的思路全部指望到調整線程池上，很多時候架構上的改變更能解決問題，比如利用背壓機制的Reactive Stream、合理的拆分等。

今天，我從 Java 創建的幾種線程池開始，對 Executor 框架的主要組成、線程池結構與生命週期等方面進行了講解和分析，希望對你有所幫助。

一課一練

關於今天我們討論的題目你做到心中有數了嗎？今天的思考題是從邏輯上理解，線程池創建和生命週期。請談一談，如果利用 newSingleThreadExecutor() 創建一個線程池，corePoolSize、maxPoolSize 等都是什麼數值？ThreadFactory 可能在線程池生命週期中被使用多少次？怎麼驗證自己的判斷？

21、Java併發類庫提供的線程池有哪幾種？分別有什麼特點？（高併發編程----7）

今天我要問你的問題是，Java 併發類庫提供的線程池有哪幾種？分別有什麼特點？

典型回答

考點分析

知識擴展

下面我就從源碼角度，分析線程池的設計與實現，我將主要圍繞最基礎的 ThreadPoolExecutor 源碼。

進一步分析，線程池既然有生命週期，它的狀態是如何表徵的呢？

線程池實踐

線程池大小的選擇策略

一課一練

14、談談你知道的設計模式？

15、synchronized和ReentrantLock有什麼區別呢？（高併發編程----1）

09、java集合類----Map集合

06、談談 Java 反射機制，動態代理是基於什麼原理？

11、BIO、NIO、AIO（1）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

21、Java併發類庫提供的線程池有哪幾種？ 分別有什麼特點？（高併發編程----7）

今天我要問你的問題是，Java 併發類庫提供的線程池有哪幾種？ 分別有什麼特點？

典型回答

考點分析

知識擴展

下面我就從源碼角度，分析線程池的設計與實現，我將主要圍繞最基礎的 ThreadPoolExecutor 源碼。

進一步分析，線程池既然有生命週期，它的狀態是如何表徵的呢？

線程池實踐

線程池大小的選擇策略

一課一練

21、Java併發類庫提供的線程池有哪幾種？分別有什麼特點？（高併發編程----7）

今天我要問你的問題是，Java 併發類庫提供的線程池有哪幾種？分別有什麼特點？