看了這篇Dubbo RPC面試題,讓天下沒有難面的面試題!

RPC非常重要,很多人面試的時候都掛在了這個地方!你要是還不懂RPC是什麼?他的基本原理是什麼?你一定要把下邊的內容記起來!好好研究一下!特別是文中給出的一張關於RPC的基本流程圖,重點中的重點,Dubbo RPC的基本執行流程就是他,RPC框架的基本原理也是他,別說我沒告訴你!看了下邊的內容你要掌握的內容如下,當然還有很多:

  • RPC的由來,是怎樣一步步演進出來的;
  • RPC的基本架構是什麼;
  • RPC的基本實現原理,就是下邊的這張圖,重點中的重點;
  • REST 和 SOAP、RPC 有何區別呢?

整個調用的過程經歷了哪幾步和Spring MVC的執行流程一樣,相當重要;

 

爲什麼要有RPC

隨着互聯網的發展,網站應用的規模不斷擴大,常規的垂直應用架構已無法應對,分佈式服務架構以及流動計算架構勢在必行,亟需一個治理系統確保架構有條不紊的演進。
在這裏插入圖片描述

單一應用架構

當網站流量很小時,只需一個應用,將所有功能都部署在一起,以減少部署節點和成本。此時,用於簡化增刪改查工作量的數據訪問框架(ORM) 是關鍵。

垂直應用架構

當訪問量逐漸增大,單一應用增加機器帶來的加速度越來越小,將應用拆成互不相干的幾個應用,以提升效率。此時,用於加速前端頁面開發的 Web框架(MVC) 是關鍵。

分佈式服務架構

當垂直應用越來越多,應用之間交互不可避免,將核心業務抽取出來,作爲獨立的服務,逐漸形成穩定的服務中心,使前端應用能更快速的響應多變的市場需求。

此時,用於提高業務複用及整合的分佈式服務框架(RPC),提供統一的服務是關鍵。

例如:各個團隊的服務提供方就不要各自實現一套序列化、反序列化、網絡框架、連接池、收發線程、超時處理、狀態機等“業務之外”的重複技術勞動,造成整體的低效。

PS: 其實上述三個原因也是爲什麼要有Dubbo的原因!不信你去Dubbo官網去看!

流動計算架構

PS:這個屬於擴展內容,摘自Dubbo官網,屬於架構演進的一個過程

當服務越來越多,容量的評估,小服務資源的浪費等問題逐漸顯現,此時需增加一個調度中心基於訪問壓力實時管理集羣容量,提高集羣利用率。此時,用於提高機器利用率的資源調度和治理中心(SOA)是關鍵。

另外一個原因

就是因爲在幾個進程內(應用分佈在不同的機器上),無法共用內存空間,或者在一臺機器內通過本地調用無法完成相關的需求,比如不同的系統之間的通訊,甚至不同組織之間的通訊。此外由於機器的橫向擴展,需要在多臺機器組成的集羣上部署應用等等。

所以,統一RPC框架來解決提供統一的服務。

 

什麼是RPC

RPC(Remote Procedure Call Protocol)遠程過程調用協議,它是一種通過網絡從遠程計算機程序上請求服務,而不需要了解底層網絡技術的協議。簡言之,RPC使得程序能夠像訪問本地系統資源一樣,去訪問遠端系統資源。比較關鍵的一些方面包括:通訊協議、序列化、資源(接口)描述、服務框架、性能、語言支持等。
在這裏插入圖片描述
簡單的說,RPC就是從一臺機器(客戶端)上通過參數傳遞的方式調用另一臺機器(服務器)上的一個函數或方法(可以統稱爲服務)並得到返回的結果。

 

PRC架構組件

一個基本的RPC架構裏面應該至少包含以下4個組件:

  • 客戶端 (Client):服務調用方(服務消費者)
  • 客戶端存根 (Client Stub):存放服務端地址信息,將客戶端的請求參數數據信息打包成網絡消息,再通過網絡傳輸發送給服務端
  • 服務端存根 (Server Stub):接收客戶端發送過來的請求消息並進行解包,然後再調用本地服務進行處理
  • 服務端 (Server):服務的真正提供者
    在這裏插入圖片描述
    具體調用過程:
  1. 服務消費者(client客戶端)通過調用本地服務的方式調用需要消費的服務;
  2. 客戶端存根(client stub)接收到調用請求後負責將方法、入參等信息序列化(組裝)成能夠進行網絡傳輸的消息體;
  3. 客戶端存根(client stub)找到遠程的服務地址,並且將消息通過網絡發送給服務端;
  4. 服務端存根(server stub)收到消息後進行解碼(反序列化操作);
  5. 服務端存根(server stub)根據解碼結果調用本地的服務進行相關處理;
  6. 本地服務執行具體業務邏輯並將處理結果返回給服務端存根(server stub);
  7. 服務端存根(server stub)將返回結果重新打包成消息(序列化)並通過網絡發送至消費方;
  8. 客戶端存根(client stub)接收到消息,並進行解碼(反序列化);
  9. 服務消費方得到最終結果;

而RPC框架的實現目標則是將上面的第2-10步完好地封裝起來,也就是把調用、編碼/解碼的過程給封裝起來,讓用戶感覺上像調用本地服務一樣的調用遠程服務。

 

RPC和SOA、SOAP、REST的區別

REST

可以看着是HTTP協議的一種直接應用,默認基於JSON作爲傳輸格式,使用簡單,學習成本低效率高,但是安全性較低。

SOAP

SOAP是一種數據交換協議規範,是一種輕量的、簡單的、基於XML的協議的規範。而SOAP可以看着是一個重量級的協議,基於XML、SOAP在安全方面是通過使用XML-Security和XML-Signature兩個規範組成了WS-Security來實現安全控制的,當前已經得到了各個廠商的支持 。

它有什麼優點?簡單總結爲:易用、靈活、跨語言、跨平臺。

SOA

面向服務架構,它可以根據需求通過網絡對鬆散耦合的粗粒度應用組件進行分佈式部署、組合和使用。服務層是SOA的基礎,可以直接被應用調用,從而有效控制系統中與軟件代理交互的人爲依賴性。

SOA是一種粗粒度、鬆耦合服務架構,服務之間通過簡單、精確定義接口進行通訊,不涉及底層編程接口和通訊模型。SOA可以看作是B/S模型、XML(標準通用標記語言的子集)/Web Service技術之後的自然延伸。

REST 和 SOAP、RPC 有何區別呢?

沒什麼太大區別,他們的本質都是提供可支持分佈式的基礎服務,最大的區別在於他們各自的的特點所帶來的不同應用場景 。

 

RPC框架需要解決的問題?

  1. 如何確定客戶端和服務端之間的通信協議?
  2. 如何更高效地進行網絡通信?
  3. 服務端提供的服務如何暴露給客戶端?
  4. 客戶端如何發現這些暴露的服務?
  5. 如何更高效地對請求對象和響應結果進行序列化和反序列化操作?

 

RPC的實現基礎?

  1. 需要有非常高效的網絡通信,比如一般選擇Netty作爲網絡通信框架;
  2. 需要有比較高效的序列化框架,比如谷歌的Protobuf序列化框架;
  3. 可靠的尋址方式(主要是提供服務的發現),比如可以使用Zookeeper來註冊服務等等;
  4. 如果是帶會話(狀態)的RPC調用,還需要有會話和狀態保持的功能;

 

RPC使用了哪些關鍵技術?

動態代理

生成Client Stub(客戶端存根)和Server Stub(服務端存根)的時候需要用到Java動態代理技術,可以使用JDK提供的原生的動態代理機制,也可以使用開源的:CGLib代理,Javassist字節碼生成技術。

序列化和反序列化

在網絡中,所有的數據都將會被轉化爲字節進行傳送,所以爲了能夠使參數對象在網絡中進行傳輸,需要對這些參數進行序列化和反序列化操作。

序列化:把對象轉換爲字節序列的過程稱爲對象的序列化,也就是編碼的過程。

反序列化:把字節序列恢復爲對象的過程稱爲對象的反序列化,也就是解碼的過程。

目前比較高效的開源序列化框架:如Kryo、FastJson和Protobuf等。

NIO通信

出於併發性能的考慮,傳統的阻塞式 IO 顯然不太合適,因此我們需要異步的 IO,即 NIO。Java 提供了 NIO 的解決方案,Java 7 也提供了更優秀的 NIO.2 支持。可以選擇Netty或者MINA來解決NIO數據傳輸的問題。

服務註冊中心

可選:Redis、Zookeeper、Consul 、Etcd。一般使用ZooKeeper提供服務註冊與發現功能,解決單點故障以及分佈式部署的問題(註冊中心)。

 

主流RPC框架有哪些

RMI

利用java.rmi包實現,基於Java遠程方法協議(Java Remote Method Protocol) 和java的原生序列化。

Hessian

是一個輕量級的remoting onhttp工具,使用簡單的方法提供了RMI的功能。 基於HTTP協議,採用二進制編解碼。

protobuf-rpc-pro

是一個Java類庫,提供了基於 Google 的 Protocol Buffers 協議的遠程方法調用的框架。基於 Netty 底層的 NIO 技術。支持 TCP 重用/ keep-alive、SSL加密、RPC 調用取消操作、嵌入式日誌等功能。

Thrift

是一種可伸縮的跨語言服務的軟件框架。它擁有功能強大的代碼生成引擎,無縫地支持C + +,C#,Java,Python和PHP和Ruby。thrift允許你定義一個描述文件,描述數據類型和服務接口。依據該文件,編譯器方便地生成RPC客戶端和服務器通信代碼。

最初由facebook開發用做系統內個語言之間的RPC通信,2007年由facebook貢獻到apache基金 ,現在是apache下的opensource之一 。支持多種語言之間的RPC方式的通信:php語言client可以構造一個對象,調用相應的服務方法來調用java語言的服務,跨越語言的C/S RPC調用。底層通訊基於SOCKET。

Avro

出自Hadoop之父Doug Cutting, 在Thrift已經相當流行的情況下推出Avro的目標不僅是提供一套類似Thrift的通訊中間件,更是要建立一個新的,標準性的雲計算的數據交換和存儲的Protocol。支持HTTP,TCP兩種協議。

Dubbo

Dubbo是 阿里巴巴公司開源的一個高性能優秀的服務框架,使得應用可通過高性能的 RPC 實現服務的輸出和輸入功能,可以和 Spring框架無縫集成。

 

RPC的實現原理架構圖

在這裏插入圖片描述
在這裏插入圖片描述
PS:這張圖非常重點,是PRC的基本原理,請大家一定記住!

也就是說兩臺服務器A,B,一個應用部署在A服務器上,想要調用B服務器上應用提供的函數/方法,由於不在一個內存空間,不能直接調用,需要通過網絡來表達調用的語義和傳達調用的數據。

比如說,A服務器想調用B服務器上的一個方法:User getUserByName(String userName)

1、建立通信

首先要解決通訊的問題:即A機器想要調用B機器,首先得建立起通信連接。

主要是通過在客戶端和服務器之間建立TCP連接,遠程過程調用的所有交換的數據都在這個連接裏傳輸。連接可以是按需連接,調用結束後就斷掉,也可以是長連接,多個遠程過程調用共享同一個連接。

通常這個連接可以是按需連接(需要調用的時候就先建立連接,調用結束後就立馬斷掉),也可以是長連接(客戶端和服務器建立起連接之後保持長期持有,不管此時有無數據包的發送,可以配合心跳檢測機制定期檢測建立的連接是否存活有效),多個遠程過程調用共享同一個連接。

2、服務尋址

要解決尋址的問題,也就是說,A服務器上的應用怎麼告訴底層的RPC框架,如何連接到B服務器(如主機或IP地址)以及特定的端口,方法的名稱名稱是什麼。

通常情況下我們需要提供B機器(主機名或IP地址)以及特定的端口,然後指定調用的方法或者函數的名稱以及入參出參等信息,這樣才能完成服務的一個調用。

可靠的尋址方式(主要是提供服務的發現)是RPC的實現基石,比如可以採用Redis或者Zookeeper來註冊服務等等。
在這裏插入圖片描述

2.1、從服務提供者的角度看:

當服務提供者啓動的時候,需要將自己提供的服務註冊到指定的註冊中心,以便服務消費者能夠通過服務註冊中心進行查找;

當服務提供者由於各種原因致使提供的服務停止時,需要向註冊中心註銷停止的服務;

服務的提供者需要定期向服務註冊中心發送心跳檢測,服務註冊中心如果一段時間未收到來自服務提供者的心跳後,認爲該服務提供者已經停止服務,則將該服務從註冊中心上去掉。

2.2、從調用者的角度看:

服務的調用者啓動的時候根據自己訂閱的服務向服務註冊中心查找服務提供者的地址等信息;

當服務調用者消費的服務上線或者下線的時候,註冊中心會告知該服務的調用者;

服務調用者下線的時候,則取消訂閱。

3、網絡傳輸

3.1、序列化

當A機器上的應用發起一個RPC調用時,調用方法和其入參等信息需要通過底層的網絡協議如TCP傳輸到B機器,由於網絡協議是基於二進制的,所有我們傳輸的參數數據都需要先進行序列化(Serialize)或者編組(marshal)成二進制的形式才能在網絡中進行傳輸。然後通過尋址操作和網絡傳輸將序列化或者編組之後的二進制數據發送給B機器。

3.2、反序列化

當B機器接收到A機器的應用發來的請求之後,又需要對接收到的參數等信息進行反序列化操作(序列化的逆操作),即將二進制信息恢復爲內存中的表達方式,然後再找到對應的方法(尋址的一部分)進行本地調用(一般是通過生成代理Proxy去調用,

通常會有JDK動態代理、CGLIB動態代理、Javassist生成字節碼技術等),之後得到調用的返回值。

4、服務調用

B機器進行本地調用(通過代理Proxy和反射調用)之後得到了返回值,此時還需要再把返回值發送回A機器,同樣也需要經過序列化操作,然後再經過網絡傳輸將二進制數據發送回A機器,而當A機器接收到這些返回值之後,則再次進行反序列化操作,恢復爲內存中的表達方式,最後再交給A機器上的應用進行相關處理(一般是業務邏輯處理操作)。

通常,經過以上四個步驟之後,一次完整的RPC調用算是完成了,另外可能因爲網絡抖動等原因需要重試等。

發佈了159 篇原創文章 · 獲贊 28 · 訪問量 6萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章