一篇讀懂分佈式架構下的負載均衡

一篇讀懂分佈式架構下的負載均衡

微信公衆號:IT一刻鐘
大型現實非嚴肅主義現場
一刻鐘與你分享優質技術架構與見聞,做一個有劇情的程序員
關注可第一時間瞭解更多精彩內容,定期有福利相送喲。

圖片描述

什麼是負載均衡?

百度詞條裏的解釋是:負載均衡,英文叫Load Balance,意思就是將請求或者數據分攤到多個操作單元上進行執行,共同完成工作任務。
它的目的就通過調度集羣,達到最佳化資源使用,最大化吞吐率,最小化響應時間,避免單點過載的問題。

負載均衡分類

負載均衡可以根據網絡協議的層數進行分類,我們這裏以ISO模型爲準,從下到上分爲:
物理層,數據鏈路層,網絡層,傳輸層,會話層,表示層,應用層。
當客戶端發起請求,會經過層層的封裝,發給服務器,服務器收到請求後經過層層的解析,獲取到對應的內容。
圖片描述

二層負載均衡

二層負債均衡是基於數據鏈路層的負債均衡,即讓負債均衡服務器和業務服務器綁定同一個虛擬IP(即VIP),客戶端直接通過這個VIP進行請求,那麼如何區分相同IP下的不同機器呢?沒錯,通過MAC物理地址,每臺機器的MAC物理地址都不一樣,當負載均衡服務器接收到請求之後,通過改寫HTTP報文中以太網首部的MAC地址,按照某種算法將請求轉發到目標機器上,實現負載均衡。
這種方式負載方式雖然控制粒度比較粗,但是優點是負載均衡服務器的壓力會比較小,負載均衡服務器只負責請求的進入,不負責請求的響應(響應是有後端業務服務器直接響應給客戶端),吞吐量會比較高。
圖片描述

三層負載均衡

三層負載均衡是基於網絡層的負載均衡,通俗的說就是按照不同機器不同IP地址進行轉發請求到不同的機器上。
這種方式雖然比二層負載多了一層,但從控制的顆粒度上看,並沒有比二層負載均衡更有優勢,並且,由於請求的進出都要經過負載均衡服務器,會對其造成比較大的壓力,性能也比二層負載均衡要差。
圖片描述

四層負載均衡

四層負載均衡是基於傳輸層的負載均衡,傳輸層的代表協議就是TCP/UDP協議,除了包含IP之外,還有區分了端口號,通俗的說就是基於IP+端口號進行請求的轉發。相對於上面兩種,控制力度縮小到了端口,可以針對同一機器上的不用服務進行負載。
這一層以LVS爲代表。
圖片描述

七層負載均衡

七層負載均衡是基於應用層的負載均衡,應用層的代表協議有HTTP,DNS等,可以根據請求的url進行轉發負載,比起四層負載,會更加的靈活,所控制到的粒度也是最細的,使得整個網絡更"智能化"。例如訪問一個網站的用戶流量,可以通過七層的方式,將對圖片類的請求轉發到特定的圖片服務器並可以使用緩存技術;將對文字類的請求可以轉發到特定的文字服務器並可以使用壓縮技術。可以說功能是非常強大的負載。
圖片描述
這一層以Nginx爲代表。

在普通的應用架構中,使用Nginx完全可以滿足需求,對於一些大型應用,一般會採用DNS+LVS+Nginx的方式進行多層次負債均衡,以上這些說明都是基於軟件層面的負載均衡,在一些超大型的應用中,還會在前面多加一層物理負載均衡,比如知名的F5。

負載均衡算法

負載均衡算法分爲兩類:
一種是靜態負載均衡,一種是動態負載均衡。

靜態均衡算法:

1、輪詢法
將請求按順序輪流地分配到每個節點上,不關心每個節點實際的連接數和當前的系統負載。
優點:簡單高效,易於水平擴展,每個節點滿足字面意義上的均衡;
缺點:沒有考慮機器的性能問題,根據木桶最短木板理論,集羣性能瓶頸更多的會受性能差的服務器影響。
圖片描述

2、隨機法
將請求隨機分配到各個節點。由概率統計理論得知,隨着客戶端調用服務端的次數增多,其實際效果越來越接近於平均分配,也就是輪詢的結果。
優缺點和輪詢相似。
圖片描述

3、源地址哈希法
源地址哈希的思想是根據客戶端的IP地址,通過哈希函數計算得到一個數值,用該數值對服務器節點數進行取模,得到的結果便是要訪問節點序號。採用源地址哈希法進行負載均衡,同一IP地址的客戶端,當後端服務器列表不變時,它每次都會落到到同一臺服務器進行訪問。
優點:相同的IP每次落在同一個節點,可以人爲干預客戶端請求方向,例如灰度發佈;
缺點:如果某個節點出現故障,會導致這個節點上的客戶端無法使用,無法保證高可用。當某一用戶成爲熱點用戶,那麼會有巨大的流量涌向這個節點,導致冷熱分佈不均衡,無法有效利用起集羣的性能。所以當熱點事件出現時,一般會將源地址哈希法切換成輪詢法。
圖片描述

4、加權輪詢法
不同的後端服務器可能機器的配置和當前系統的負載並不相同,因此它們的抗壓能力也不相同。給配置高、負載低的機器配置更高的權重,讓其處理更多的請;而配置低、負載高的機器,給其分配較低的權重,降低其系統負載,加權輪詢能很好地處理這一問題,並將請求順序且按照權重分配到後端。
加權輪詢算法要生成一個服務器序列,該序列中包含n個服務器。n是所有服務器的權重之和。在該序列中,每個服務器的出現的次數,等於其權重值。並且,生成的序列中,服務器的分佈應該儘可能的均勻。比如序列{a, a, a, a, a, b, c}中,前五個請求都會分配給服務器a,這就是一種不均勻的分配方法,更好的序列應該是:{a, a, b, a, c, a, a}。
優點:可以將不同機器的性能問題納入到考量範圍,集羣性能最優最大化;
缺點:生產環境複雜多變,服務器抗壓能力也無法精確估算,靜態算法導致無法實時動態調整節點權重,只能粗糙優化。
圖片描述

5、加權隨機法
與加權輪詢法一樣,加權隨機法也根據後端機器的配置,系統的負載分配不同的權重。不同的是,它是按照權重隨機請求後端服務器,而非順序。

6、鍵值範圍法
根據鍵的範圍進行負債,比如0到10萬的用戶請求走第一個節點服務器,10萬到20萬的用戶請求走第二個節點服務器……以此類推。
優點:容易水平擴展,隨着用戶量增加,可以增加節點而不影響舊數據;
缺點:容易負債不均衡,比如新註冊的用戶活躍度高,舊用戶活躍度低,那麼壓力就全在新增的服務節點上,舊服務節點性能浪費。而且也容易單點故障,無法滿足高可用。
圖片描述

(注:以上所提到的單點故障,都可以用主從方式來解決,從節點監聽主節點心跳,當發現主節點死亡,從節點切換成主節點頂替上去。這裏可以思考一個問題,怎麼設計集羣主從可以最大程度上降低成本)

動態負債均衡算法:

1、最小連接數法
根據每個節點當前的連接情況,動態地選取其中當前積壓連接數最少的一個節點處理當前請求,儘可能地提高後端服務的利用效率,將請求合理地分流到每一臺服務器。俗稱閒的人不能閒着,大家一起動起來。
優點:動態,根據節點狀況實時變化;
缺點:提高了複雜度,每次連接斷開需要進行計數;
實現:將連接數的倒數當權重值。

2、最快響應速度法
根據請求的響應時間,來動態調整每個節點的權重,將響應速度快的服務節點分配更多的請求,響應速度慢的服務節點分配更少的請求,俗稱能者多勞,扶貧救弱。
優點:動態,實時變化,控制的粒度更細,跟靈敏;
缺點:複雜度更高,每次需要計算請求的響應速度;
實現:可以根據響應時間進行打分,計算權重。

3、觀察模式法
觀察者模式是綜合了最小連接數和最快響應度,同時考量這兩個指標數,進行一個權重的分配。

說在後面話

還有哪些負載均衡的算法,或者有更好的想法或問題,歡迎留言交流!

圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章