花了一個星期,我終於把RPC框架整明白了

推薦閱讀:

https://blog.csdn.net/m0_46995061/article/details/106124211

https://blog.csdn.net/m0_46995061/article/details/106148048

https://blog.csdn.net/m0_46995061/article/details/106470873

RPC(Remote Procedure Call):遠程過程調用,它是一種通過網絡從遠程計算機程序上請求服務,而不需要了解底層網絡技術的思想。

花了一個星期,我終於把RPC框架整明白了

 

RPC 是一種技術思想而非一種規範或協議,常見 RPC 技術和框架有:

  • 應用級的服務框架:阿里的 Dubbo/Dubbox、Google gRPC、Spring Boot/Spring Cloud。
  • 遠程通信協議:RMI、Socket、SOAP(HTTP XML)、REST(HTTP JSON)。
  • 通信框架:MINA 和 Netty。

目前流行的開源 RPC 框架還是比較多的,有阿里巴巴的 Dubbo、Facebook 的 Thrift、Google 的 gRPC、Twitter 的 Finagle 等。

下面重點介紹三種:

  • gRPC:是 Google 公佈的開源軟件,基於最新的 HTTP 2.0 協議,並支持常見的衆多編程語言。RPC 框架是基於 HTTP 協議實現的,底層使用到了 Netty 框架的支持。
  • Thrift:是 Facebook 的開源 RPC 框架,主要是一個跨語言的服務開發框架。
  • 用戶只要在其之上進行二次開發就行,應用對於底層的 RPC 通訊等都是透明的。不過這個對於用戶來說需要學習特定領域語言這個特性,還是有一定成本的。
  • Dubbo:是阿里集團開源的一個極爲出名的 RPC 框架,在很多互聯網公司和企業應用中廣泛使用。協議和序列化框架都可以插拔是極其鮮明的特色。

完整的 RPC 框架

在一個典型 RPC 的使用場景中,包含了服務發現、負載、容錯、網絡傳輸、序列化等組件,其中“RPC 協議”就指明瞭程序如何進行網絡傳輸和序列化。

花了一個星期,我終於把RPC框架整明白了

 

圖 1:完整 RPC 架構圖

如下是 Dubbo 的設計架構圖,分層清晰,功能複雜:

花了一個星期,我終於把RPC框架整明白了

 

圖 2:Dubbo 架構圖

花了一個星期,我終於把RPC框架整明白了

 

RPC 核心功能

RPC 的核心功能是指實現一個 RPC 最重要的功能模塊,就是上圖中的”RPC 協議”部分:

花了一個星期,我終於把RPC框架整明白了

 

圖 3:RPC 核心功能

一個 RPC 的核心功能主要有 5 個部分組成,分別是:客戶端、客戶端 Stub、網絡傳輸模塊、服務端 Stub、服務端等。

花了一個星期,我終於把RPC框架整明白了

 

圖 4:RPC 核心功能圖

下面分別介紹核心 RPC 框架的重要組成:

  • 客戶端(Client):服務調用方。
  • 客戶端存根(Client Stub):存放服務端地址信息,將客戶端的請求參數數據信息打包成網絡消息,再通過網絡傳輸發送給服務端。
  • 服務端存根(Server Stub):接收客戶端發送過來的請求消息並進行解包,然後再調用本地服務進行處理。
  • 服務端(Server):服務的真正提供者。
  • Network Service:底層傳輸,可以是 TCP 或 HTTP。

Python 自帶 RPC Demo

花了一個星期,我終於把RPC框架整明白了

 

開啓服務端:

花了一個星期,我終於把RPC框架整明白了

 

開啓客戶端:

花了一個星期,我終於把RPC框架整明白了

 

Wireshark 抓包分析過程

客戶端去往服務端:

  • 客戶端 IP:172.171.4.176
  • 服務端 IP:172.171.5.95

通信使用 HTTP 協議,XML 文件傳輸格式。傳輸的字段包括:方法名 methodName,兩個參數 2,3。

花了一個星期,我終於把RPC框架整明白了

 

圖 5:Request 抓包

服務端返回結果,字段返回值 Value,結果是 5:

花了一個星期,我終於把RPC框架整明白了

 

圖 6:Response 抓包

在這兩次網絡傳輸中使用了 HTTP 協議,建立 HTTP 協議之間有 TCP 三次握手,斷開 HTTP 協議時有 TCP 四次揮手。

花了一個星期,我終於把RPC框架整明白了

 

圖 7:基於 HTTP 協議的 RPC 連接過程

詳細調用過程

Python 自帶 RPC 的 Demo 小程序的實現過程,流程和分工角色可以用下圖來表示:

花了一個星期,我終於把RPC框架整明白了

 

圖 8:RPC 調用詳細流程圖

一次 RPC 調用流程如下:

  • 服務消費者(Client 客戶端)通過本地調用的方式調用服務。
  • 客戶端存根(Client Stub)接收到調用請求後負責將方法、入參等信息序列化(組裝)成能夠進行網絡傳輸的消息體。
  • 客戶端存根(Client Stub)找到遠程的服務地址,並且將消息通過網絡發送給服務端。
  • 服務端存根(Server Stub)收到消息後進行解碼(反序列化操作)。
  • 服務端存根(Server Stub)根據解碼結果調用本地的服務進行相關處理
  • 服務端(Server)本地服務業務處理。
  • 處理結果返回給服務端存根(Server Stub)。
  • 服務端存根(Server Stub)序列化結果。
  • 服務端存根(Server Stub)將結果通過網絡發送至消費方。
  • 客戶端存根(Client Stub)接收到消息,並進行解碼(反序列化)。
  • 服務消費方得到最終結果。

花了一個星期,我終於把RPC框架整明白了

 

RPC 核心之功能實現

RPC 的核心功能主要由 5 個模塊組成,如果想要自己實現一個 RPC,最簡單的方式要實現三個技術點,分別是:

  • 服務尋址
  • 數據流的序列化和反序列化
  • 網絡傳輸

服務尋址

服務尋址可以使用 Call ID 映射。在本地調用中,函數體是直接通過函數指針來指定的,但是在遠程調用中,函數指針是不行的,因爲兩個進程的地址空間是完全不一樣的。

所以在 RPC 中,所有的函數都必須有自己的一個 ID。這個 ID 在所有進程中都是唯一確定的。

客戶端在做遠程過程調用時,必須附上這個 ID。然後我們還需要在客戶端和服務端分別維護一個函數和Call ID的對應表。

當客戶端需要進行遠程調用時,它就查一下這個表,找出相應的 Call ID,然後把它傳給服務端,服務端也通過查表,來確定客戶端需要調用的函數,然後執行相應函數的代碼。

實現方式:服務註冊中心。

要調用服務,首先你需要一個服務註冊中心去查詢對方服務都有哪些實例。Dubbo 的服務註冊中心是可以配置的,官方推薦使用 Zookeeper。

實現案例:RMI(Remote Method Invocation,遠程方法調用)也就是 RPC 本身的實現方式。

花了一個星期,我終於把RPC框架整明白了

 

圖 9:RMI 架構圖

Registry(服務發現):藉助 JNDI 發佈並調用了 RMI 服務。實際上,JNDI 就是一個註冊表,服務端將服務對象放入到註冊表中,客戶端從註冊表中獲取服務對象。

RMI 服務在服務端實現之後需要註冊到 RMI Server 上,然後客戶端從指定的 RMI 地址上 Lookup 服務,調用該服務對應的方法即可完成遠程方法調用。

Registry 是個很重要的功能,當服務端開發完服務之後,要對外暴露,如果沒有服務註冊,則客戶端是無從調用的,即使服務端的服務就在那裏。

序列化和反序列化

客戶端怎麼把參數值傳給遠程的函數呢?在本地調用中,我們只需要把參數壓到棧裏,然後讓函數自己去棧裏讀就行。

但是在遠程過程調用時,客戶端跟服務端是不同的進程,不能通過內存來傳遞參數。

這時候就需要客戶端把參數先轉成一個字節流,傳給服務端後,再把字節流轉成自己能讀取的格式。

只有二進制數據才能在網絡中傳輸,序列化和反序列化的定義是:

  • 將對象轉換成二進制流的過程叫做序列化
  • 將二進制流轉換成對象的過程叫做反序列化

這個過程叫序列化和反序列化。同理,從服務端返回的值也需要序列化反序列化的過程。

網絡傳輸

網絡傳輸:遠程調用往往用在網絡上,客戶端和服務端是通過網絡連接的。

所有的數據都需要通過網絡傳輸,因此就需要有一個網絡傳輸層。網絡傳輸層需要把 Call ID 和序列化後的參數字節流傳給服務端,然後再把序列化後的調用結果傳回客戶端。

只要能完成這兩者的,都可以作爲傳輸層使用。因此,它所使用的協議其實是不限的,能完成傳輸就行。

儘管大部分 RPC 框架都使用 TCP 協議,但其實 UDP 也可以,而 gRPC 乾脆就用了 HTTP2。

TCP 的連接是最常見的,簡要分析基於 TCP 的連接:通常 TCP 連接可以是按需連接(需要調用的時候就先建立連接,調用結束後就立馬斷掉),也可以是長連接(客戶端和服務器建立起連接之後保持長期持有,不管此時有無數據包的發送,可以配合心跳檢測機制定期檢測建立的連接是否存活有效),多個遠程過程調用共享同一個連接。

所以,要實現一個 RPC 框架,只需要把以下三點實現了就基本完成了:

  • Call ID 映射:可以直接使用函數字符串,也可以使用整數 ID。映射表一般就是一個哈希表。
  • 序列化反序列化:可以自己寫,也可以使用 Protobuf 或者 FlatBuffers 之類的。
  • 網絡傳輸庫:可以自己寫 Socket,或者用 Asio,ZeroMQ,Netty 之類。

 

RPC 核心之網絡傳輸協議

在第三節中說明了要實現一個 RPC,需要選擇網絡傳輸的方式。

花了一個星期,我終於把RPC框架整明白了

 

圖 10:網絡傳輸

在 RPC 中可選的網絡傳輸方式有多種,可以選擇 TCP 協議、UDP 協議、HTTP 協議。

每一種協議對整體的性能和效率都有不同的影響,如何選擇一個正確的網絡傳輸協議呢?首先要搞明白各種傳輸協議在 RPC 中的工作方式。

基於 TCP 協議的 RPC 調用

由服務的調用方與服務的提供方建立 Socket 連接,並由服務的調用方通過 Socket 將需要調用的接口名稱、方法名稱和參數序列化後傳遞給服務的提供方,服務的提供方反序列化後再利用反射調用相關的方法。

最後將結果返回給服務的調用方,整個基於 TCP 協議的 RPC 調用大致如此。

但是在實例應用中則會進行一系列的封裝,如 RMI 便是在 TCP 協議上傳遞可序列化的 Java 對象。

基於 HTTP 協議的 RPC 調用

該方法更像是訪問網頁一樣,只是它的返回結果更加單一簡單。

其大致流程爲:由服務的調用者向服務的提供者發送請求,這種請求的方式可能是 GET、POST、PUT、DELETE 等中的一種,服務的提供者可能會根據不同的請求方式做出不同的處理,或者某個方法只允許某種請求方式。

而調用的具體方法則是根據 URL 進行方法調用,而方法所需要的參數可能是對服務調用方傳輸過去的 XML 數據或者 JSON 數據解析後的結果,最後返回 JOSN 或者 XML 的數據結果。

由於目前有很多開源的 Web 服務器,如 Tomcat,所以其實現起來更加容易,就像做 Web 項目一樣。

兩種方式對比

基於 TCP 的協議實現的 RPC 調用,由於 TCP 協議處於協議棧的下層,能夠更加靈活地對協議字段進行定製,減少網絡開銷,提高性能,實現更大的吞吐量和併發數。

但是需要更多關注底層複雜的細節,實現的代價更高。同時對不同平臺,如安卓,iOS 等,需要重新開發出不同的工具包來進行請求發送和相應解析,工作量大,難以快速響應和滿足用戶需求。

基於 HTTP 協議實現的 RPC 則可以使用 JSON 和 XML 格式的請求或響應數據。

而 JSON 和 XML 作爲通用的格式標準(使用 HTTP 協議也需要序列化和反序列化,不過這不是該協議下關心的內容,成熟的 Web 程序已經做好了序列化內容),開源的解析工具已經相當成熟,在其上進行二次開發會非常便捷和簡單。

但是由於 HTTP 協議是上層協議,發送包含同等內容的信息,使用 HTTP 協議傳輸所佔用的字節數會比使用 TCP 協議傳輸所佔用的字節數更高。

因此在同等網絡下,通過 HTTP 協議傳輸相同內容,效率會比基於 TCP 協議的數據效率要低,信息傳輸所佔用的時間也會更長,當然壓縮數據,能夠縮小這一差距。

使用 RabbitMQ 的 RPC 架構

在 OpenStack 中服務與服務之間使用 RESTful API 調用,而在服務內部則使用 RPC 調用各個功能模塊。

正是由於使用了 RPC 來解耦服務內部功能模塊,使得 OpenStack 的服務擁有擴展性強,耦合性低等優點。

OpenStack 的 RPC 架構中,加入了消息隊列 RabbitMQ,這樣做的目的是爲了保證 RPC 在消息傳遞過程中的安全性和穩定性。

下面分析 OpenStack 中使用 RabbitMQ 如何實現 RPC 的調用。

RabbitMQ 簡介

以下摘錄自知乎:

對於初學者,舉一個飯店的例子來解釋這三個分別是什麼吧。不是百分百恰當,但是應該足以解釋這三者的區別。

RPC:假設你是一個飯店裏的服務員,顧客向你點菜,但是你不會做菜,所以你採集了顧客要點什麼之後告訴後廚去做顧客點的菜,這叫 RPC(remote procedure call),因爲廚房的廚師相對於服務員而言是另外一個人(在計算機的世界裏就是 Remote 的機器上的一個進程)。廚師做好了的菜就是RPC的返回值。

任務隊列和消息隊列:本質都是隊列,所以就只舉一個任務隊列的例子。假設這個飯店在高峯期顧客很多,而廚師只有很少的幾個,所以服務員們不得不把單子按下單順序放在廚房的桌子上,供廚師們一個一個做,這一堆單子就是任務隊列,廚師們每做完一個菜,就從桌子上的訂單裏再取出一個單子繼續做菜。

角色分擔如下圖:

花了一個星期,我終於把RPC框架整明白了

 

圖 11:RabbitMQ 在 RPC 中角色

使用 RabbitMQ 的好處:

  • 同步變異步:可以使用線程池將同步變成異步,但是缺點是要自己實現線程池,並且強耦合。使用消息隊列可以輕鬆將同步請求變成異步請求。
  • 低內聚高耦合:解耦,減少強依賴。
  • 流量削峯:通過消息隊列設置請求最大值,超過閥值的拋棄或者轉到錯誤界面。
  • 網絡通信性能提高:TCP 的創建和銷燬開銷大,創建 3 次握手,銷燬 4 次分手,高峯時成千上萬條的鏈接會造成資源的巨大浪費,而且操作系統每秒處理 TCP 的數量也是有數量限制的,必定造成性能瓶頸。
  • RabbitMQ 採用信道通信,不採用 TCP 直接通信。一條線程一條信道,多條線程多條信道,公用一個 TCP 連接。
  • 一條 TCP 連接可以容納無限條信道(硬盤容量足夠的話),不會造成性能瓶頸。

RabbitMQ 的三種類型的交換器

RabbitMQ 使用 Exchange(交換機)和 Queue(隊列)來實現消息隊列。

在 RabbitMQ 中一共有三種交換機類型,每一種交換機類型都有很鮮明的特徵。

基於這三種交換機類型,OpenStack 完成兩種 RPC 的調用方式。首先簡單介紹三種交換機。

花了一個星期,我終於把RPC框架整明白了

 

圖 12:RabbitMQ 架構圖

①廣播式交換器類型(Fanout)

該類交換器不分析所接收到消息中的 Routing Key,默認將消息轉發到所有與該交換器綁定的隊列中去。

花了一個星期,我終於把RPC框架整明白了

 

圖 13:廣播式交換機

②直接式交換器類型(Direct)

該類交換器需要精確匹配 Routing Key 與 Binding Key,如消息的 Routing Key = Cloud,那麼該條消息只能被轉發至 Binding Key = Cloud 的消息隊列中去。

花了一個星期,我終於把RPC框架整明白了

 

圖 14:直接式交換機

③主題式交換器(Topic Exchange)

該類交換器通過消息的 Routing Key 與 Binding Key 的模式匹配,將消息轉發至所有符合綁定規則的隊列中。

Binding Key 支持通配符,其中“*”匹配一個詞組,“#”匹配多個詞組(包括零個)。

花了一個星期,我終於把RPC框架整明白了

 

圖 15:主題式交換機

注:以上四張圖片來自博客園,如有侵權,請聯繫作者:
https://www.cnblogs.com/dwlsxj/p/RabbitMQ.html。

當生產者發送消息 Routing Key=F.C.E 的時候,這時候只滿足 Queue1,所以會被路由到 Queue 中。

如果 Routing Key=A.C.E 這時候會被同時路由到 Queue1 和 Queue2 中,如果 Routing Key=A.F.B 時,這裏只會發送一條消息到 Queue2 中。

Nova 基於 RabbitMQ 實現兩種 RPC 調用:

  • RPC.CALL(調用)
  • RPC.CAST(通知)

其中 RPC.CALL 基於請求與響應方式,RPC.CAST 只是提供單向請求,兩種 RPC 調用方式在 Nova 中均有典型的應用場景。

RPC.CALL

RPC.CALL 是一種雙向通信流程,即 RabbitMQ 接收消息生產者生成的系統請求消息,消息消費者經過處理之後將系統相應結果反饋給調用程序。

花了一個星期,我終於把RPC框架整明白了

 

圖 16:RPC.CALL 原理圖

一個用戶通過 Dashboard 創建一個虛擬機,界面經過消息封裝後發送給 NOVA-API。

NOVA-API 作爲消息生產者,將該消息以 RPC.CALL 方式通過 Topic 交換器轉發至消息隊列。

此時,Nova-Compute 作爲消息消費者,接收該信息並通過底層虛擬化軟件執行相應虛擬機的啓動進程。

待用戶虛擬機成功啓動之後,Nova-Compute 作爲消息生產者通過 Direct 交換器和響應的消息隊列將虛擬機啓動成功響應消息反饋給 Nova-API。

此時 Nova-API 作爲消息消費者接收該消息並通知用戶虛擬機啓動成功。

花了一個星期,我終於把RPC框架整明白了

 

RPC.CALL 工作原理如下圖:

花了一個星期,我終於把RPC框架整明白了

 

圖 17:RPC.CALL 具體實現圖

工作流程:

  • 客戶端創建 Message 時指定 reply_to 隊列名、correlation_id 標記調用者。
  • 通過隊列,服務端收到消息。調用函數處理,然後返回。
  • 返回的隊列是 reply_to 指定的隊列,並攜帶 correlation_id。
  • 返回消息到達客戶端,客戶端根據 correlation_id 判斷是哪一個函數的調用返回。

如果有多個線程同時進行遠程方法調用,這時建立在 Client Server 之間的 Socket 連接上會有很多雙方發送的消息傳遞,前後順序也可能是隨機的。

Server 處理完結果後,將結果消息發送給 Client,Client 收到很多消息,怎麼知道哪個消息結果是原先哪個線程調用的?

Client 線程每次通過 Socket 調用一次遠程接口前,生成一個唯一的 ID,即 Request ID(Request ID必需保證在一個 Socket 連接裏面是唯一的),一般常常使用 AtomicLong 從 0 開始累計數字生成唯一 ID。

RPC.CAST

RPC.CAST 的遠程調用流程與 RPC.CALL 類似,只是缺少了系統消息響應流程。

一個 Topic 消息生產者發送系統請求消息到 Topic 交換器,Topic 交換器根據消息的 Routing Key 將消息轉發至共享消息隊列。

與共享消息隊列相連的所有 Topic 消費者接收該系統請求消息,並把它傳遞給響應的服務端進行處理。

其調用流程如圖所示:

花了一個星期,我終於把RPC框架整明白了

 

圖 18:RPC.CAST 原理圖

連接設計

RabbitMQ 實現的 RPC 對網絡的一般設計思路:消費者是長連接,發送者是短連接。但可以自由控制長連接和短連接。

一般消費者是長連接,隨時準備接收處理消息;而且涉及到 RabbitMQ Queues、Exchange 的 auto-deleted 等沒特殊需求沒必要做短連接。發送者可以使用短連接,不會長期佔住端口號,節省端口資源。

Nova 中 RPC 代碼設計:

花了一個星期,我終於把RPC框架整明白了

 

簡單對比 RPC 和 Restful API

RESTful API 架構

REST 最大的幾個特點爲:資源、統一接口、URI 和無狀態。

①資源

所謂"資源",就是網絡上的一個實體,或者說是網絡上的一個具體信息。它可以是一段文本、一張圖片、一首歌曲、一種服務,就是一個具體的實在。

②統一接口

RESTful 架構風格規定,數據的元操作,即 CRUD(Create,Read,Update 和 Delete,即數據的增刪查改)操作,分別對應於 HTTP 方法:GET 用來獲取資源,POST 用來新建資源(也可以用於更新資源),PUT 用來更新資源,DELETE 用來刪除資源,這樣就統一了數據操作的接口,僅通過 HTTP 方法,就可以完成對數據的所有增刪查改工作。

③URL

可以用一個 URI(統一資源定位符)指向資源,即每個 URI 都對應一個特定的資源。

要獲取這個資源,訪問它的 URI 就可以,因此 URI 就成了每一個資源的地址或識別符。

④無狀態

所謂無狀態的,即所有的資源,都可以通過 URI 定位,而且這個定位與其他資源無關,也不會因爲其他資源的變化而改變。有狀態和無狀態的區別,舉個簡單的例子說明一下。

如查詢員工的工資,如果查詢工資是需要登錄系統,進入查詢工資的頁面,執行相關操作後,獲取工資的多少,則這種情況是有狀態的。

因爲查詢工資的每一步操作都依賴於前一步操作,只要前置操作不成功,後續操作就無法執行。

如果輸入一個 URI 即可得到指定員工的工資,則這種情況是無狀態的,因爲獲取工資不依賴於其他資源或狀態。

且這種情況下,員工工資是一個資源,由一個 URI 與之對應,可以通過 HTTP 中的 GET 方法得到資源,這是典型的 RESTful 風格。

RPC 和 Restful API 對比

面對對象不同:

  • RPC 更側重於動作。
  • REST 的主體是資源。

RESTful 是面向資源的設計架構,但在系統中有很多對象不能抽象成資源,比如登錄,修改密碼等而 RPC 可以通過動作去操作資源。所以在操作的全面性上 RPC 大於 RESTful。

傳輸效率:

  • RPC 效率更高。RPC,使用自定義的 TCP 協議,可以讓請求報文體積更小,或者使用 HTTP2 協議,也可以很好的減少報文的體積,提高傳輸效率。

複雜度:

  • RPC 實現複雜,流程繁瑣。
  • REST 調用及測試都很方便。

RPC 實現(參見第一節)需要實現編碼,序列化,網絡傳輸等。而 RESTful 不要關注這些,RESTful 實現更簡單。

靈活性:

  • HTTP 相對更規範,更標準,更通用,無論哪種語言都支持 HTTP 協議。
  • RPC 可以實現跨語言調用,但整體靈活性不如 RESTful。

總結

RPC 主要用於公司內部的服務調用,性能消耗低,傳輸效率高,實現複雜。

HTTP 主要用於對外的異構環境,瀏覽器接口調用,App 接口調用,第三方接口調用等。

RPC 使用場景(大型的網站,內部子系統較多、接口非常多的情況下適合使用 RPC):

  • 長鏈接。不必每次通信都要像 HTTP 一樣去 3 次握手,減少了網絡開銷。
  • 註冊發佈機制。RPC 框架一般都有註冊中心,有豐富的監控管理;發佈、下線接口、動態擴展等,對調用方來說是無感知、統一化的操作。
  • 安全性,沒有暴露資源操作。
  • 微服務支持。就是最近流行的服務化架構、服務化治理,RPC 框架是一個強力的支撐。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章