一、引子
nio是java的IO框架裏邊十分重要的一部分內容,其最核心的就是提供了非阻塞IO的處理方式,最典型的應用場景就是處理網絡連接。很多同學提起nio都能說起一二,但是細究其背後的原理、思想往往就開始背書,說來說去都是那麼幾句,其中不少人並不見的真的很理解。本人之前就屬於此類,看了很多書和博客,但是大多數都只是講了三件套和怎麼使用,很少會很細緻的講背後的思想,那本次我們就來扒一扒吧。
很多博客描述nio都是這麼說的:基於Reactor模式實現的多路非阻塞高性能的網絡IO。那麼我們就從這個定義來分析,其中兩個關鍵點:多路非阻塞和Reactor模式。(本來想把高性能也算進去,但是後來想想這個應該算前兩者的結果)下邊我們來分別搞懂這兩塊。
二、網絡IO模型
多路非阻塞其實準確的名字叫做IO多路複用模型,其是linux五種網絡模型之一,也是當前網絡編程最常使用的模型之一。至於詳細的介紹請參考博客:高性能IO模型淺析(這個裏邊只給出了4中,沒有信號驅動IO,但講的很贊,特別是圖),這裏僅作簡要介紹和對比:
- 阻塞IO:java中老的bio便是這種模式,在接到事件(數據到達、數據拷貝完成等)前程序需阻塞等待。優點是編碼簡單,缺點是效率低,處理程序阻塞會導致cpu利用率很低。
- 非阻塞IO:在未接到事件時處理程序一直主動輪詢,這樣處理程序無需阻塞,可以在輪詢間歇去幹別的,但是輪詢會造成重複請求,同樣浪費資源。以前java中實現的的僞異步模式就是採用這種思想。
- IO複用模型:增加了對socket的事件監聽器(selector),從而把處理程序和對應的socket事件解耦,所用的socket連接都註冊在監聽器,在等待階段只有監聽器會阻塞,處理線程從監聽器獲取事件對socket連接處理即可,而且一個處理線程可以對應多個連接(前兩種一般都是一個socket連接起一個線程,這就是爲什麼叫複用),有點是節省資源,由於處理程序能夠被多個連接複用,因此少數的線程就能處理大量連接。缺點同樣因爲複用,如果是大量費時處理的連接(如大量連接上傳大文件),很容易造成線程佔滿而導致新連接失敗。
- 信號驅動IO模型:在數據準別階段無需阻塞,只需向系統註冊一個信號,在數據準備好後,系統會響應該信號。該模型依賴於系統實現,而且信號通信使用比較麻煩,因此java中未有對應實現。
- 異步IO:與信號驅動IO很類似,而且在數據拷貝階段(指數據從系統緩衝區拷貝至程序自己的緩衝區,其他模型改階段程序都需要阻塞等待)同樣可以異步處理。有點不必多說,效率很高,缺點是依賴系統底層實現。目前很多語言都提供該模型的實現,jdk1.7之後同樣在concurrent包中提供了。
對比以上五種模型可以知道,IO複用模型從效率和實現成本綜合而言目前是比較好的選擇,這就是java基於該模型實現nio的根本原因。上邊提到了IO複用模型的實現思想,其實這種思想在其他語言中早已實現(如C++中據說流弊哄哄超10w行代碼的ACE,自適配通信環境,就採用了該模型),並且提出了一個叫Reactor的設計模式。
三、Reactor模式
Reactor模式,翻譯過來叫做反引器模式,其目的是在事件驅動的應用中,將一個請求的能夠分離並且調度給應用程序。我相信大多數人都沒看明白前一句的意思(書還是要背的),說白了就是對於一個請求的多個事件(如連接、讀寫等),經過這種模式的處理,能夠區分出來,並且分別交給對應的處理模塊處理。廢話不多說,來看下一個簡圖:
四、NIO
- channel:管道,可以看做對流的封裝,有點像pipe,不過其是全雙工的。其好處是屏蔽了底層細節,不用關心流對應的是文件還是網絡,也不用關心連接怎麼處理的,而且全雙工,不用考慮輸入流或輸出流,你只用使用buffer對其進行讀寫就行了。
- buffer:channel的好基友,底層就是個字節數組,不同的是對其進行了封裝,不僅提供了對基本類型的支持,而且內部維持了讀寫位置(postion、limit、capacity、mark等),還提供了便捷的方法(clear、flip)。對channel的讀寫必須通過buffer。
- selector:這個不多說了,如果前邊認真看基本上就明白乾啥的,就是Reactor模式中Acceptor的實現。
再來看個簡圖吧:
基本上和Reactor能對應上,少了個dispatcher,這是由於jdk本身提供的nio比較基本,dispatcher一般都由我們自己實現,而在我理解中,mina、netty這些框架很重要的一方面也是提供了該部分的實現。
原址:http://www.cnblogs.com/good-temper/p/5003892.html