分佈式系統關注點——如何去實施「負載均衡」?

本文長度爲3032字,預計讀完需1.1MB流量,建議閱讀8分鐘。


前面兩篇《分佈式系統關注點——初識「高可用」》、《分佈式系統關注點——僅需這一篇,吃透「負載均衡」妥妥的》看完後,相信大家對實現高可用的思路和負載均衡的策略有了一些瞭解。這篇主要闡述一下在實施的時候主流的一些解決方案。


一、爲什麼沒有DNS?

再翻出第一篇中放出的一張圖來回顧一下。


之前也有的小夥伴問到,爲什麼沒有列出DNS?我認爲,DNS的本質是解決「domain name --> ip」的問題。雖然DNS除了在公網運用的之外,還會運用於做內網的自定義domain name解析,但是在程序裏單靠它來做負載均衡的話,還是太勉強了。


當然,基於DNS“智能解析”功能可以做到IP的動態返回,也算起到了負載均衡的作用。但是,由於其本身是一個工作在L3(網絡層)的解決方案,所以無法對“端口”進行工作。而一般我們程序之間的通訊很多都會涉及到端口,因此我們本篇先不討論DNS~


二、如何實施?

在清楚了我們應該在哪些環節考慮做負載均衡之後,接下去就是思考如何能夠循序漸進的進行。

古時候軍隊打仗的時候一般都是拿盾的抗在前面,頂住***。而負載均衡解決方案從某種角度來說也是一個類似盾一般的防禦性設施,因爲前提就是要能承載上游過來的流量。因此,越往“前”做負載均衡解決方案,效果肯定會越好,因爲受保護的應用範圍越廣。


如果說,系統之前沒有運用過負載均衡,現在開始第一次做,該如何選擇呢?小Z根據心目當中的優先級來和大家聊一下。

01 硬件負載均衡


硬件這塊名氣最大的還屬F5(根據ZOL的數據,其在市場佔有率51.44%),大大蓋過了其它幾家硬件商的風頭。此類硬件負載均衡器的特點是“壕”,畢竟是純商業化的東西,投入的資源和精力自然是衆多開源軟件負載均衡所無法比擬的,所以功能非常強大。包含訪問加速、壓縮、安全等等負載均衡之外的許多附加功能。

題外話:如果用F5組網的話,有兩種結構,串行結構和並行結構,也稱爲直連模式和旁路模式。前者的優勢在對硬件產生壓力較小、且天然安全性高,而後者對原網絡架構的改動較小、且擴展性較好。大家在實際的使用中結合自身情況來部署。


“壕”物能夠同時支持L2~L7的轉發,所以上圖中的每一個標註點都可以用硬件來做負載均衡。因此,如果在經濟允許的情況下,直接上F5能解決很多原本需要花更多時間去解決的問題。所以當“時間”的重要度大於“金錢”的時候,建議優先採用硬件方案。

02 軟件負載均衡(L7)


當“金錢”的重要程度大於“時間”的時候,我們可以通過軟件來達到我們要的效果。相應的,也增加了一些運維成本。


一般情況下,只要對數據庫不濫用,往往我們從「單應用 + 單庫」組合最先需要突破的是應用,變成「多應用 + 單庫」。那麼針對Web應用的L7負載均衡,比較主流的產品是2個Nginx、HAProxy。在L7做負載均衡,最大的特點就是靈活,請求的URL、Header都是我們可以去掌控的,所以我們可以利用其中的任何信息爲負載均衡策略所用。


這一類就是前面圖中的「反向代理」。作爲「客戶端」和「Web應用」、「前端」和「後端」之間的橋樑。實際操作中主要做2步:

  1. 在公網的域名解析中,配置解析到「反向代理」。記錄類型是「A」,記錄值是「反向代理」的IP。

  2. 配置真實提供服務的Web應用IP和端口,和負載均衡均衡策略。上圖中的配置是Nginx中的示例,負載均衡策略的缺省值是輪詢。

03 軟件負載均衡(L4)


當「Web應用」所依賴的TCP協議的「服務」需要橫向擴展,或者需要做「數據庫」、「分佈式緩存」的多主、主從集羣時,那麼就需要一個支持L4的負載均衡軟件。這裏最知名的就屬LVS了,1998年5月由章文嵩博士建立,2004年底被納入Lunix內核。也正因爲它是內核態的程序,所以相比用Nginx、HAProxy來做L4的負載均衡,在性能、資源的消耗上會更優一些。

實際運用中的操作步驟主要也是2步:

  1. 1在LVS中添加一個IP虛擬服務(IPVS),並指定它的IP、端口和負載均衡策略。

  2. 將IP虛擬服務關聯到真實的服務上,並指定模式和權重的信息。(做L4的負載均衡可以使用NAT或者FULLNAT模式)


題外話:LVS的模式一共有四種,除了NAT和FULLNAT(NAT的增強版)模式外,它的TUN模式可以在L3做負載均衡,DR模式可以在L2做負載均衡,到這個層面其實就和做硬件同處於一個層次了。並且,隨着層次的深入,雖然對功能性上有所弱化,但是如果不考慮端口的話,單從IP層面的負載均衡來說,用DR模式做,則對數據包的加工介入度會降到最低,因此也是通過軟件做負載均衡能夠達到的性能極致。

另外,LVS中運用的虛擬IP概念,本質上和Nginx中的“server”概念一樣,定義了一個統一入口,作用上並沒有差別。將Nginx中的upstream關聯到server,就如LVS操作步驟第2點中的關聯一般。


這些每個具體的解決方案的使用教程網上比較多,就不展開了,大家實際用到的時候自行查閱一下,當然儘量優先看官方的。


三、優缺點

做了一個苦差事,把所有同類型的產品都整合了一下優缺點和使用場景。不過,其中有不少是我沒用過的,所以僅供大家參考。順手將一些網上到處充斥的一些過時結論做了更新,如:Nginx不支持session sticky等。


我們可以看到,不同的解決方案有不同的側重點。因此在單個解決方案已經無法滿足的情況下,我們可以組合使用,各盡所長。


負載均衡這個領域還是以高可用和性能爲2個最重要因素,下面是小Z推薦的一種組合方式,也是在系統量級達到每小時上億PV之後最被廣泛使用的一種。理論上,利用第一步DNS的域名解析所帶的負載均衡效果,只要複製多套LVS主備出來,綁上多個不同的虛IP,可以做到無限橫向擴展,以支撐不斷增長的流量。


用到的3個軟件目前都是開源產品,LVS+Keepalived負責做Nginx的負載均衡,而Nginx負責分發到實際的請求到Http和Tcp協議的應用上。

關於LVS的模式選擇,如果在同網段內的話優先使用DR模式進行L2轉發,性能最好。否則使用TUN模式進行L3分發。與此同時,在L4、L7的分發上使用Nginx來做,可以發揮其靈活易擴展的特點以及其它的一些額外特性如緩存等,也算是物盡其用。


雲時代,service mesh風興起。以sidecar模式爲核心的後起之秀Linkerd、Conduit、NginMesh、Istio等軟件除了滿足負載均衡之外,還爲高可用相關的做了衆多的考量,後續有機會小Z和大家一起來梳理一下。很久之前寫過一篇調研服務治理框架的文章,裏面順帶有提到一下,有興趣的小夥伴們可以跳過去看看:《分佈式系統中的必備良藥 —— 服務治理》。


四、結語

有些事,並不需要做到一步到位,做技術也是這樣。其實大部分情況下,在以上方案中選擇一個,做一層轉發就夠了。行遠自邇,避免給自己添不必要的麻煩。


相關文章:

分佈式系統關注點——初識「高可用」

分佈式系統關注點——僅需這一篇,吃透「負載均衡」妥妥的

分佈式系統中的必備良藥 —— 服務治理


▶ 關於作者:張帆(Zachary,個人微信號:Zachary-ZF)。堅持用心打磨每一篇高質量原創。

微信公衆號(首發):跨界架構師<-- 點擊後閱讀熱門文章

定期發表原創內容:架構設計丨分佈式系統丨產品丨運營丨一些深度思考

掃碼加入小圈子

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章