異步/多線程/任務/並行編程之一:如何選擇合適的多線程模型?

異步、多線程、任務、並行編程之一:選擇合適的多線程模型

本篇概述:

@FCL4.0中已經存在的線程模型,以及它們之間異同點;

@多線程編程模型的選擇。

 

1:異步、多線程、任務、並行的本質

這四個概念對應在CLR中的本質,本質都是多線程。

異步,簡單的講就是BeginInvoke、EndInvoke模式,它在CLR內部線程池進行管理;

多線程,體現在C#中,可以由類型Thread發起。也可以由ThreadPool發起。前者不受CLR線程池管理,後者則是。FCL團隊爲了各種編程模型的方便,還另外提供了BackgroundWorker和若干個Timer,基本上它們都是ThreadPool的加強,增加了一些和調用者線程的交互功能;

任務(Task),爲FCL4.0新增的功能,在一個稱之爲任務並行庫(TPL)的地方,其實也就是System.Threading.Tasks命名空間下。任務並行庫名字取的很玄乎,其實它也是CLR線程池的加強。優化了線程間的調度算法,增加了和調用者線程的交互功能;

並行(Parallel),爲FCL4.0新增的功能,也屬於TPL。並行在後臺使用Task進行管理,說白了,因爲Task使用的線程池線程,所以Parallel自然使用的也是線程池線程進行管理,它的本質僅僅是進一步簡化了Task。在這裏要增進一個對於並行的理解。實際上,多線程天然就是並行的。及時不用任務並行庫,用Thread類型新起兩個線程,CLR或者說Windows系統也會將這兩個線程根據需要安排到兩個CPU上去執行。所以,並不是因爲多了任務並行庫,CLR才支持並行計算,任務並行庫只是提供了一組API,使我們能夠更好的操縱線程進行並行開發而已。

2:遺憾

Jeffrey Richter大叔說,微軟提供了這麼多線程模型,是遺憾的,因爲這製造了混亂。很多開發者都不知道該選用哪個類型來編寫自己的多線程代碼。我們對微軟總是又愛又恨,它總是不停的更新一些東西,逼迫我們不停的學習。但是也好,進步導致它不會過早死掉,讓我們徹底失掉飯碗。
C#剛出來的被人笑,現在它的很多語法特性已經比Java優美。很多時候我們太擅長於嘲笑,以致最後只能哭。順便說一句,我依然是那麼的喜歡JAVA,只是很久沒用它而已。

3:現在,該用什麼來編寫多線程 

如果你在FRAMEWORK4.0下編寫代碼,那麼應該按照這個優先級來撰寫多線程代碼: 

優先

次優先

不得以

Parallel(含擴展庫PLinq)

Task

ThreadPool(BackgroundWorker,Timer)

異步

Thread

這個表滿足了大部分情況下的一個優先級指導,但在某些情況下會有例外。

3.1:爲什麼 Parallel和Task優先級一樣,而不是優於Task?

Parallel雖然在後臺使用Task進行管理,並且它所謂簡化了對於Task的操作,但是它有一個重要的特徵區別與Task:Parallel會阻滯調用者線程。查看Paralle的成員,有For、ForEach、Invoke方法,它甚至都沒提供一個BeginInvoke方法,也很好的暗示了這一點。不過雖然是同步的執行的,Parallel還是會把多個任務分配到多個CPU上去。
Task被用的最多的是Start方法,它不會阻滯主線程。雖然Task也提供了同步的啓動線程的方法RunSynchronously,但一般用的不多。 

3.2:何時用異步,何時用線程或線程池

這需要從“IO操作的DMA(Direct Memory Access)模式”講起。通過DMA的數據交換幾乎可以不損耗CPU的資源。在硬件部分,硬盤、網卡、聲卡、顯卡等都有DMA功能。可以簡單的認爲,當我們的工作線程需要操作I/O資源的時候(如讀取一個大文件、讀取一個網頁、讀取Socke包等),我們就需要用異步去做這些事情。異步模式只會在工作開始以及工作結束的時候佔用CLR線程池,其它時候由硬盤、網卡等硬件設備來處理具體的工作,這就不會過多佔用到CPU空間和時間損耗。 

概括而言:

計算密集型工作,直接採用線程;

IO密集型工作,採用異步機制;

當我們不清楚什麼工作是I/O密集型的,一個不是很恰當的指導就是:查看FCL類型成員,如果成員提供了類似BeginDosomething方法的,則優先使用它,而不是新起一個線程或丟到線程池。

3.3:線程池的優勢

新起線程,會帶來很大的開銷,這些開銷主要集中在:分配線程內核對象、線程環境塊、用戶模式棧、內核模式棧所需要的內存空間,加載的DLL的DLLMain方法,並傳遞連接標誌,以及線程上下文切換。由於線程如此昂貴,所以對於普通的開發要求來說,線程池就是一個很好的選擇。線程池替開發人員管理工作線程,當一項工作完畢的時候,CLR不會銷燬這個線程,而是會保留這個線程一段時間,看是否有別的工作需要這個線程。至於何時銷燬或新起線程,由CLR決定。


3.4:何時用Thread 
以上的各種線程模型,它們最終都是Thread。 那麼什麼時候需要Thread直接出場呢?

最重要的使用Thread的理由是,我們需要控制線程的優先級。Thread之上的線程模型都不支持優先級設置。設置一個線程的高優先級可以使它獲得更多的CPU時間;

再者,可以控制線程爲前臺線程。當然,由Thread新起的線程默認就是前臺線程。前臺線程不隨着調用者線程的中斷而中斷,這使得我們可以用Thread來進行一些關鍵性的操作。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章