【Executor框架】Java中的線程池(ThreadPoolExecutor實現原理、使用、狀態維護)

目錄

1 爲什麼使用線程池

2 線程池的實現原理

3 線程池的使用

3.1 線程池的創建

3.2 向線程池提交任務

3.3 關閉線程池

3.4 合理的配置線程池

3.5 線程池的監控

4 線程池狀態維護


本人使用的jdk版本爲8。

1 爲什麼使用線程池

在開發過程中,合理地使用線程池能夠帶來3個好處。

  • 降低資源消耗。通過重複利用已創建的線程降低線程創建和銷燬造成的消耗。
  • 提高響應速度。當任務到達時,任務可以不需要等到線程創建就能立即執行。
  • 提高線程的可管理性。線程是稀缺資源,如果無限制地創建,不僅會消耗系統資源,還會降低系統的穩定性,使用線程池可以進行統一分配、調優和監控。但是,要做到合理利用線程池,必須對其實現原理了如指掌。

2 線程池的實現原理

當向線程池提交一個任務之後,線程池是如何處理這個任務的呢?下圖是使用ThreadPoolExecutor 調用 execute() 方法來執行一個提交過來的線程。

當執行execute()方法後,會出現下面四種情況(相關參數介紹見第3點):

  • 如果當前運行的線程少於corePoolSize,則創建新線程來執行任務(注意,執行這一步驟需要獲取全局鎖)。
  • 如果運行的線程等於或多於corePoolSize,則將任務加入BlockingQueue
  • 如果無法將任務加入BlockingQueue(隊列已滿),則創建新的線程來處理任務(注意,執行這一步驟需要獲取全局鎖)。
  • 如果創建新線程將使當前運行的線程超出maximumPoolSize,任務將被拒絕,並調用RejectedExecutionHandler.rejectedExecution()方法。

ThreadPoolExecutor採取上述步驟的總體設計思路,是爲了在執行execute()方法時,儘可能地避免獲取全局鎖(那將會是一個嚴重的可伸縮瓶頸)。在ThreadPoolExecutor完成預熱之後(當前運行的線程數大於等於corePoolSize),幾乎所有的execute()方法調用都是執行第二步 ,而第二步不需要獲取全局鎖。

3 線程池的使用

3.1 線程池的創建

我們可以通過ThreadPoolExecutor來創建一個線程池,當然並不僅限於這一種方式。

ThreadPoolExecutor(corePoolSize, maximumPoolSize, keepAliveTime,
                unit, workQueue, threadFactory, handler);

創建一個線程池時需要輸入幾個參數:

  • corePoolSize(線程池的基本大小):當提交一個任務到線程池時,線程池會創建一個線程來執行任務,即使其他空閒的基本線程能夠執行新任務也會創建線程,等到需要執行的任務數大於線程池基本大小時就不再創建。
    如果調用了線程池的prestartAllCoreThreads()方法,線程池會提前創建並啓動所有基本線程。

  • maximumPoolSize(線程池最大數量):線程池允許創建的最大線程數。如果隊列滿了,並且已創建的線程數小於最大線程數,則線程池會再創建新的線程執行任務。值得注意的是,如果使用了無界的任務隊列這個參數就沒什麼效果。

  • keepAliveTime(線程活動保持時間):當線程池中的線程數超過了corePoolSize,超出的那部分線程能夠空閒的最大時間,當空閒時間超出keepAliveTime,這些線程就會被回收。所以,如果任務很多,並且每個任務執行的時間比較短,可以調大時間,提高線程的利用率。

還有一個成員變量boolean allowCoreThreadTimeOut,當該變量值爲true時(默認爲false),keepAliveTime也能影響到corePool內的線程。

  • TimeUnit(線程活動保持時間的單位),可選的單位有:

    • 天(DAYS
    • 小時(HOURS
    • 分鐘(MINUTES
    • 毫秒(MILLISECONDS
    • 微秒(MICROSECONDS,千分之一毫秒)
    • 納秒(NANOSECONDS,千分之一微秒)
  • workQueue(任務隊列):用於保存等待執行的任務的阻塞隊列。可以選擇以下幾個阻塞隊列:

    • ArrayBlockingQueue:是一個基於數組結構的有界阻塞隊列,此隊列按FIFO(先進先出)原則對元素進行排序。
    • LinkedBlockingQueue:一個基於鏈表結構的阻塞隊列,此隊列按FIFO排序元素,吞吐量通常要高於ArrayBlockingQueue。靜態工廠方法Executors.newFixedThreadPool()使用了這個隊列。
    • SynchronousQueue:一個不存儲元素的阻塞隊列。每個插入操作必須等到另一個線程調用移除操作,否則插入操作一直處於阻塞狀態,吞吐量通常要高於LinkedBlockingQueue,靜態工廠方法Executors.newCachedThreadPool使用了這個隊列。
    • PriorityBlockingQueue:一個具有優先級的無限阻塞隊列。
  • ThreadFactory:用於設置創建線程的工廠,可以通過線程工廠給每個創建出來的線程設置更有意義的名字。使用開源框架guava提供的ThreadFactoryBuilder可以快速給線程池裏的線程設置有意義的名字,代碼如下:

    new ThreadFactoryBuilder().setNameFormat("XX-task-%d").build();
    
  • RejectedExecutionHandler(飽和策略):當隊列和線程池都滿了,說明線程池處於飽和狀態,那麼必須採取一種策略處理提交的新任務。這個策略默認情況下是AbortPolicy,表示無法處理新任務時拋出異常。在JDK 1.5中Java線程池框架提供了以下4種策略。

    • AbortPolicy:直接拋出異常。
    • CallerRunsPolicy:只用調用者所在線程來運行任務。
    • DiscardOldestPolicy:丟棄隊列裏最近的一個任務,並執行當前任務。
    • DiscardPolicy:不處理,丟棄掉。

    當然,也可以根據應用場景需要來實現RejectedExecutionHandler接口自定義策略。如記錄日誌或持久化存儲不能處理的任務。

3.2 向線程池提交任務

可以使用兩個方法向線程池提交任務,分別爲execute()submit()方法。

  • execute()方法用於提交不需要返回值的任務,所以無法判斷任務是否被線程池執行成功。通過以下代碼可知execute()方法輸入的任務是一個Runnable類的實例。
    threadsPool.execute(new Runnable() {
        @Override
        public void run() {
            // TODO Auto-generated method stub
        }
    });
    
  • submit()方法用於提交需要返回值的任務。線程池會返回一個future類型的對象,通過這個future對象可以判斷任務是否執行成功,並且可以通過futureget()方法來獲取返回值,get()方法會阻塞當前線程直到任務完成,而使用get(long timeout,TimeUnit unit)方法則會阻塞當前線程一段時間後立即返回,這時候有可能任務沒有執行完。
    Future<Object> future = executor.submit(harReturnValuetask);
    try {
        Object s = future.get();
    } catch (InterruptedException e) {
        // 處理中斷異常
    } catch (ExecutionException e) {
        // 處理無法執行任務異常
    } finally {
        // 關閉線程池
        executor.shutdown();
    }

3.3 關閉線程池

可以通過調用線程池的shutdownshutdownNow方法來關閉線程池。
它們的原理是遍歷線程池中的工作線程,然後逐個調用線程的interrupt方法來中斷線程,所以無法響應中斷的任務可能永遠無法終止。
但是它們存在一定的區別:

  • shutdownNow首先將線程池的狀態設置成STOP,然後嘗試停止所有的正在執行或暫停任務的線程,並返回等待執行任務的列表,
  • shutdown只是將線程池的狀態設置成SHUTDOWN狀態,然後中斷所有沒有正在執行任務的線程。

只要調用了這兩個關閉方法中的任意一個,isShutdown方法就會返回true。當所有的任務都已關閉後,才表示線程池關閉成功,這時調用isTerminaed方法會返回true
至於應該調用哪一種方法來關閉線程池,應該由提交到線程池的任務特性決定:

  • 通常調用shutdown方法來關閉線程池。
  • 如果任務不一定要執行完,則可以調用shutdownNow方法。

3.4 合理的配置線程池

要想合理地配置線程池,就必須首先分析任務特性,可以從以下幾個角度來分析:

  • 任務的性質:CPU密集型任務、IO密集型任務和混合型任務。
  • 任務的優先級:高、中和低。
  • 任務的執行時間:長、中和短。
  • 任務的依賴性:是否依賴其他系統資源,如數據庫連接。

性質不同的任務可以用不同規模的線程池分開處理:

  • CPU密集型任務應配置儘可能小的線程,如配置Ncpu+1個線程的線程池。
  • IO密集型任務線程並不是一直在執行任務,則應配置儘可能多的線程,如2*Ncpu
  • 混合型的任務,如果可以拆分,將其拆分成一個CPU密集型任務和一個IO密集型任務

優先級不同的任務可以使用優先級隊列PriorityBlockingQueue來處理。它可以讓優先級高的任務先執行。

3.5 線程池的監控

如果在系統中 大量使用線程池,則有必要 對線程池進行監控,方便在出現問題時,可以根據線程池的使用狀況快速定位問題。可以通過線程池提供的參數進行監控,在監控線程池的時候可以使用以下屬性:

  • taskCount:線程池需要執行的任務數量。
  • completedTaskCount:線程池在運行過程中已完成的任務數量,小於或等於taskCount
  • largestPoolSize:線程池裏曾經創建過的最大線程數量。通過這個數據可以知道線程池是否曾經滿過。如該數值等於線程池的最大大小,則表示線程池曾經滿過。
  • getPoolSize:線程池的線程數量。如果線程池不銷燬的話,線程池裏的線程不會自動銷燬,所以這個大小隻增不減。
  • getActiveCount:獲取活動的線程數。

通過擴展線程池進行監控。可以通過繼承線程池來自定義線程池,重寫線程池的beforeExecuteafterExecuteterminated方法,也可以在任務執行前、執行後和線程池關閉前執行一些代碼來進行監控。例如,監控任務的平均執行時間最大執行時間最小執行時間 等。這幾個方法在線程池裏是空方法。

protected void beforeExecute(Thread t, Runnable r) { }

4 線程池狀態維護

通過一個原子整形變量(int類型,32位)來存儲線程池的狀態和已創建的線程個數。其中,第1~3位存線程池狀態,第4~29位存儲已創建的線程數量。

    private final AtomicInteger ctl = new AtomicInteger(ctlOf(RUNNING, 0));
    private static final int COUNT_BITS = Integer.SIZE - 3;         // 29
    private static final int CAPACITY   = (1 << COUNT_BITS) - 1;    // 0001111...1

    // 線程池的運行狀態,存儲在ctl的高3位上
    private static final int RUNNING    = -1 << COUNT_BITS;    // 11100...0
    private static final int SHUTDOWN   =  0 << COUNT_BITS;    // 00000...0
    private static final int STOP       =  1 << COUNT_BITS;    // 00100...0
    private static final int TIDYING    =  2 << COUNT_BITS;    // 01000...0
    private static final int TERMINATED =  3 << COUNT_BITS;    // 01100...0

    // 獲取線程池狀態、已創建的線程個數、狀態元數據
    private static int runStateOf(int c)     { return c & ~CAPACITY; }
    private static int workerCountOf(int c)  { return c & CAPACITY; }
    private static int ctlOf(int rs, int wc) { return rs | wc; }
 

線程池的運行狀態如下:

  • RUNNING:表示接受新的任務進入和執行隊列中的任務。
  • SHUTDOWN:不接受新的任務,但是會執行隊列中的任務。
  • STOP:不接受新的任務,不執行隊列中的任務,並且中斷正在執行的任務。
  • TIDYING:所有的任務已經終止,線程池中的工作線程數量爲0,。
  • TERMINATED:線程池的terminated()方法已經完成。

線程池的狀態轉換是有一定的順序的,在轉換過程中不必經歷上面所有狀態,具體轉換 情況如下:

  • RUNNING -> SHUTDOWN:當執行shutdown()或finalize()方法。
  • RUNNING 或 SHUTDOWN -> STOP:當執行shutdownNow()方法。
  • SHUTDOWN -> TIDYING:都阻塞隊列和線程池都爲空。
  • STOP -> TIDYING:當線程池爲空。
  • TIDYING -> TERMINATED:當terminated()方法已經完成。

注:當線程池狀態編程TERMINATED時,因爲awaitTermination()方法而陷入等待的線程會直接返回。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章