再看hadoop RPC

再看hadoop PRC

以前寫過一篇文章叫做《hadoop RPC從入門到暫時放棄》,現在粗略的把《Hadoop 2.xHDFS源碼剖析》看完了第一遍,感覺對HDFS的整體瞭解上升了一個層次,並且重新看了一下動態代理、protocol buffer所以這次重新來寫寫對於hadoop RPC的認識。

下面還是主要通過ClientProtocol協議,即hdfs客戶端與NameNode通信的協議,來介紹一下對hadoopRPC的認識。

  1. 客戶端

首先編寫程序操作hadoop hdfs的時候,通常都是會用到DFSClient這個類的,這裏的DFSClient類中,持有一個實現了ClientProtocol接口的ClientNameNodeProtocolTranslatorPB(以下簡稱translator)的對象實例,這個實例主要的功能就是將ClientProtocol轉化爲protocol buffer方式序列化的請求,其實主要也是在這其中使用動態代理獲取了ClientNamenodeProtocolPB的代理對象來實現轉換。其中獲取translator的時候還需要考慮NameNode是否是HA模式的。

其次Client部分最主要的方法就是Client.call方法,在調用call方法時會需要獲取相應RPCServer 的連接對象(Connection),但是由於建立連接在任何一個系統中都是一個十分耗時的操作,所以connection會緩存到相應服務器的連接。Connection對象除了負責建立連接之外,還會在獲取相應請求對應的應答後喚起相應請求的線程。PRC請求除了包括經過protocol buffer序列化的參數,還有對應的請求協議的標識字段。當接收到請求相應的應答時,會根據callId喚起等待的線程,這裏根據RPC調用是否成功需要考慮是調用正常的接受應答方法還是異常的應答方法。

 

 2.服務器

NameNodeRPC服務器爲例,它有一個名爲NameNodeRpcServer的類專門負責從客戶端、DataNode、以及其他NameNode發送過來的PRC請求。由於需要處理多種PRC協議(例如從客戶端發來的ClientNameNodeProtocolPB),所以在這個類中需要一個叫做BlockingService的類,根據發送的請求中關於調用協議的信息,找出相應得serverSideTranslator來處理相應的*PB協議轉化爲真正的協議,例如通過clientNNPbService這個BlockingService將從客戶端發來的ClientNamenodeProtocolPB協議,利用clientProtocolServerTranslator轉化爲jvm能夠識別的ClientProtocol協議。

除此之外,RPC服務端還參考了reactor設計模型,採用線程池以及nio的思想,提高了併發能力,具體細節可以參考以前寫得《hadoop RPC從入門到暫時放棄》。

 

         以上差不多就是對hadoopRPC的全部認識了,以後有新的瞭解在及時更新。

                                                                                                                         肯草在深圳

                                                                                                                         2017-03-12


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章