圖文還原HTTPS原理,架構師必讀!

摘要:本文用圖文的形式一步步還原HTTPS的設計過程,進而深入瞭解原理。 


A在向B進行通信時,如果是以明文的方式進行通信,中間竊聽者會獲得雙方的傳輸的數據hello。

HTTPS要解決如下問題:

A發給B的hello消息包,即使被中間人攔截到了,也無法得知消息的內容

如何做到安全

這個問題,很多人馬上就想到了各種加密算法,什麼對稱加密、非對稱加密、DES、RSA、XX、。。。。

做到安全的最終目的:

A與B通信的內容,有且只有A和B有能力看到通信的真正內容

對於解決方案,很容易就想到了對消息進行加密。

A與B這樣的簡單通信模型,我們很容易做出選擇:


這就是對稱加密算法,其中圖中的密鑰S同時扮演加密和解密的角色。

只要這個密鑰S不公開給第三者,同時密鑰S足夠安全,就可以解決通信的安全問題。

但是,在WWW環境下,我們的Web服務器的通信模型沒有這麼簡單:


如果服務器端對所有的客戶端通信都使用同樣的對稱加密算法,無異於沒有加密。那怎麼辦呢?即能使用對稱加密算法,又不公開密鑰?

答案是:Web服務器與每個客戶端使用不同的對稱加密算法:


如何確定對稱加密算法

首先需要解決服務器端怎麼告訴客戶端該使用哪種對稱加密算法問題。

可以通過協商。


但是,你協商的過程是沒有加密的,還是會被中間人攔截。那再對這個協商過程進行對稱加密好了,但是對協商過程加密的加密還是沒有加密,怎麼辦?再加密不就好了……進入了雞生蛋蛋生雞的問題了。

如何對協商過程進行加密

密碼學領域中,有一種稱爲“非對稱加密”的加密算法,特點是私鑰加密後的密文,只要是公鑰,都可以解密,但是公鑰加密後的密文,只有私鑰可以解密。私鑰只有一個人有,而公鑰可以發給所有的人

雖然服務器端向A、B……的方向還是不安全的,但是至少A、B向服務器端方向是安全的。

解決了協商加密算法的問題:使用非對稱加密算法進行對稱加密算法協商過程。

到這裏明白了爲什麼HTTPS同時需要對稱加密算法和非對稱加密算法。

協商什麼加密算法

要達到Web服務器針對每個客戶端使用不同的對稱加密算法,同時,也不能讓第三者知道這個對稱加密算法是什麼,該怎麼解決?

使用隨機數,就是使用隨機數來生成對稱加密算法。這樣就可以做到服務器和客戶端每次交互都是新的加密算法、只有在交互的那一該才確定加密算法。

到這裏明白了爲什麼HTTPS協議握手階段會有這麼多的隨機數。

如何得到公鑰

仔細思考下,如果使用非對稱加密算法,客戶端A,B需要一開始就持有公鑰,否則無法進行加密。

所以需要解決A,B客戶端安全的獲得公鑰問題。

可以有以下方案:

方案1. 服務器端將公鑰發送給每一個客戶端

方案2. 服務器端將公鑰放到一個遠程服務器,客戶端可以請求得到

選擇方案1,因爲方案2又多了一次請求,還要另外處理公鑰的存放問題。

公鑰被調包了怎麼辦

對於方案1如果服務器端發送公鑰給客戶端時,被中間人調包了,怎麼辦?

通過下圖來理解:

顯然,讓每個客戶端的每個瀏覽器默認保存所有網站的公鑰是不現實的。

使用第三方機構的公鑰

公鑰被調包的問題出現,是因爲我們的客戶端無法分辨返回公鑰的人到底是中間人,還是真的服務器。這其實就是密碼學中提的身份驗證問題。

使用數字證書來解決,不能直接將服務器的公鑰傳遞給客戶端,而是第三方機構使用它的私鑰對我們的公鑰進行加密後,再傳給客戶端。客戶端再使用第三方機構的公鑰進行解密。

假如下圖是設計的第一版“數字證書”,證書中只有服務器交給第三方機構的公鑰,而且這個公鑰被第三方機構的私鑰加密了:

如果能解密,就說明這個公鑰沒有被中間人調包。因爲如果中間人使用自己的私鑰加密後的東西傳給客戶端,客戶端是無法使用第三方的公鑰進行解密的。

話到此,我以爲解決問題了。但是現實中HTTPS,還有一個數字簽名的概念,我沒法理解它的設計理由。

仔細思考,其實第三方機構不可能只給你一家公司製作證書,它也可能會給中間人這樣有壞心思的公司發放證書。這樣的,中間人就有機會對你的證書進行調包,客戶端在這種情況下是無法分辨出是接收的是你的證書,還是中間人的。因爲不論中間人,還是你的證書,都能使用第三方機構的公鑰進行解密。像下面這樣:

第三方機構向多家公司頒發證書的情況:

客戶端能解密同一家第三機構頒發的所有證書:

最終導致其它持有同一家第三方機構證書的中間人可以進行調包:

這個問題需要使用數字簽名技術。

數字簽名

數字簽名可以解決同一機構辦法的不同證書被篡改的問題。

證書應該放到客戶端,客戶端拿到證書後應該可以分辨證書是否被篡改了,如何才能具有這個辨別能力?

舉例:比如你是HR,你手上拿到候選人的學歷證書,證書上寫了持證人,頒發機構,頒發時間等等,同時證書上,還寫有一個最重要的:證書編號!我們怎麼鑑別這張證書是的真僞呢?只要拿着這個證書編號上相關機構去查,如果證書上的持證人與現實的這個候選人一致,同時證書編號也能對應上,那麼就說明這個證書是真實的。

客戶端也同樣可以採用這種機制,如下圖:

這個"第三方機構"如果是個遠端服務,整個交互都會慢了。所以,這個第三方機構的驗證功能只能放在客戶端的本地。

客戶端本地如何驗證證書

證書本身就已經告訴客戶端怎麼驗證證書的真僞。

也就是證書上寫着如何根據證書的內容生成證書編號。客戶端拿到證書後根據證書上的方法自己生成一個證書編號,如果生成的證書編號與證書上的證書編號相同,那麼說明這個證書是真實的。

同時,爲避免證書編號本身又被調包,所以使用第三方的私鑰進行加密。

這地方有些抽象,通過下圖幫助理解:

證書的製作如圖所示。證書中的“編號生成方法MD5”就是告訴客戶端:你使用MD5對證書的內容求值就可以得到一個證書編號。

當客戶端拿到證書後,開始對證書中的內容進行驗證,如果客戶端計算出來的證書編號與證書中的證書編號相同,則驗證通過:

但是第三方機構的公鑰怎麼跑到了客戶端的機器中呢?世界上這麼多機器。

其實呢,現實中,瀏覽器和操作系統都會維護一個權威的第三方機構列表(包括它們的公鑰)。因爲客戶端接收到的證書中會寫有頒發機構,客戶端就根據這個頒發機構的值在本地找相應的公鑰。

到這裏上文提到的,證書就是HTTPS中數字證書,證書編號就是數字簽名,而第三方機構就是指數字證書籤發機構(CA)。

CA如何頒發數字證書給服務器端的

CA如何頒發給網站管理員,而管理員又如何將這個數字證書放到我們的服務器上。

CA的申請流程如下:

拿到證書後,我們就可以將證書配置到自己的服務器上了。

HTTPS交互流程

HTTPS相比HTTP多了多次的交互,這也是性能相比HTTP差的原因之一。

上面繁瑣的流程都是爲了讓客戶端與服務器端安全地協商出一個對稱加密算法。這就是HTTPS中的SSL/TLS協議主要乾的活。剩下的就是通信時雙方使用這個對稱加密算法進行加密解密。

以下是一張HTTPS協議的真實交互圖:

總結

        HTTPS要保證客戶端與服務器端的通信安全,必須使用的對稱加密算法,但是協商對稱加密算法的過程,需要使用非對稱加密算法來保證安全,然而直接使用非對稱加密的過程本身也不安全,會有中間人篡改公鑰的可能性,所以客戶端與服務器不直接使用公鑰,而是使用數字證書籤發機構頒發的證書來保證非對稱加密過程本身的安全。這樣通過這些機制協商出一個對稱加密算法,就此雙方使用該算法進行加密解密。從而解決了客戶端與服務器端之間的通信安全問題。

本文轉載公衆號 Java架構師之路 微信號:Java-Road

http://mp.weixin.qq.com/s/3NKOCOeIUF2SGJnY7II9hA

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章