nginx負載均衡中RR和ip_hash策略分析

nginx負載均衡中RR和ip_hash策略分析

　　一、nginx的upstream目前支持負載均衡方式的分配

　　1、RR（默認）

　　每個請求按時間順序逐一分配到不同的後端服務器，假如後端服務器down掉，能自動剔除。

　　例如：

　　upstream tomcats {

　　server 10.1.1.107:88 max_fails=3 fail_timeout=3s weight=9;

　　server 10.1.1.132:80 max_fails=3 fail_timeout=3s weight=9;

　　}

　　2、ip_hash

　　每個請求按訪問ip的hash結果分配，這樣每個訪客固定訪問一個後端服務器，可以解決session的題目。

　　例如：

　　upstream tomcats {

　　ip_hash;

　　server 10.1.1.107:88;

　　server 10.1.1.132:80;

　　}

　　3、fair（第三方）

　　按後端服務器的響應時間來分配請求，響應時間短的優先分配。

　　4、url_hash（第三方）

　　按訪問url的hash結果來分配請求，使每個url定向到同一個後端服務器，後端服務器爲緩存時比較有效。

　　下面，我們針對RR和ip_hash的負載均衡策略進行分析。由於每一種負載均衡策略都是在upstream的框架中使用，upstream控制總的工作流程，負載均衡策略僅僅提供選擇或開釋server的函數，所以，我們在分析RR時結合upstream（ngx_http_upstream.c）。ip_hash大部分內容與RR一致，只是重新實現RR中的ngx_http_upstream_get_peer函數。

　　二、RR策略

　　RR機制分爲三個部分：初始化upstream，獲取一個可用的後臺服務器和開釋後臺服務器。

　　以下分析以此配置爲例:

　　upstream backend {

　　server A max_fails=3 fail_timeout=4s weight=9;

　　server B max_fails=3 fail_timeout=4s weight=9;

　　server C max_fails=3 fail_timeout=4s weight=9;

　　server D backup;

　　Server E backup;

　　}

　　2.1 初始化upstream

　　對於例子中的upstream backend來說，

　　首先初始化各個server,除了設置IP和端口號外，還要設置如下置weight，current_weight，max_fails和fail_timeout。其中max_fails和fail_timeout這兩個參數是組合使用的，表示server 假如失敗次數達到max_fails次，並保持fail_timeout秒之內該服務器不能被訪問。

　　對於serverA來說，設置如下

　　serverA.weight =9;

　　serverA.current_weight = 9; //初始值即是配置文件中的weight.

　　serverA.max_fails = 3;

　　serverA.fail_timeout = 4;

　　接着，創建兩個server類型（在下文先容中，server類型等同於peer類型，都是用來指明存儲upstream中一個server的信息）的數組，peers和backup，分別存儲正常的輪循server和備用server.並竊冬按照數組中各個server的weight值的大小，由高到底排序。

　　本例中，在數組peers中存儲serverA、serverB和serverC,並記錄server的總個數peers->number=3;在數組backup中存儲serverD和serverE,並記錄server的總個數backup->number=2;

　　最後，設置upstream中各個變量的值。

　　rrp 表示當前要輪循的server數組，初始設置爲Upstream->rrp =peers.

　　tries 表示嘗試的次數，當嘗試一個server失敗後，tries的值就會減一。初始設置爲peers的總個數。

　　Next表示當peers數組中server都失敗，不能提供服務了，通過upstream->next，切換到back數組中選擇server.

　　2.2 具體的RR策略

　　2.2.1 ）選擇最初要輪循的server, 把它給rrp->current變量，跳轉到2.2.2當一個客戶端請求到達nginx後，nginx就會在upstream的peers數組中挑選一個current_weight最大的server作爲當前請求最初要輪循的server.在peers數組中選取current_weight最大的算法如下：

　　由於peers數組中的server是按照weight值的大小排序好的。

　　它是通過雙重循環，滿足下列條件後,

　　if (peer[n].current_weight * 1000 / peer[i].current_weight> peer[n].weight * 1000 / peer[i].weight)//peer[i].current_weight不爲0

　　並且該server的current_weight大於0，就選擇sever n,把編號n賦給rrp->current，成功返回。

　　假如當upstream的peers數組中的所有server的current_weight都爲零時，立即無條件地把所有server的current_weight設置爲初始值。for(i = 0; i < peers->number; i++){

　　peer[i].current_weight = peer[i].weight;

　　}

　　然後，當所有server的current_weight設置爲初始值後，重新查找peers數組中current_weight最大的server。把編號賦給rrp->current，返回。

　　2.2.2判定當前rrp->current所指向的server是否有效，假如無效，就會讓rrp->current++，判定peers數組中下一個server，是否有效。至到找到有效的server爲止.跳轉到2.2.3; 否則跳轉到2.2.2.1

　　 判定server是否有效的方法是：

　　1）假如server的失敗次數（peers->peer[i].fails）沒有達到了max_fails所設置的最大失敗次數，則該server是有效的。

　　2）假如server已經達到了max_fails所設置的最大失敗次數，從這一時刻開始算起，在fail_timeout所設置的時間段內，server是無效的。

　　3）當server的失敗次數（peers->peer[i].fails）爲最大的失敗次數，當間隔現在的時間超過了fail_timeout所設置的時間段，則令peers->peer[i].fails=0，使得該server重新有效。

　　2.2.2.1假如peers中所有的server都是無效的; 就會嘗試往backup的數組中找一個有效的server, 假如找到，跳轉到2.2.3;假如仍然找不到，表示此時upstream中無server可以使用。就會清空所有peers數組中所有的失敗次數的記錄，使所有server都變成了有效。這樣做的目的是爲了防止下次再有請求訪問時，仍找不到一個有效的server.

　　for (i = 0; i < peers->number; i++){

　　peers->peer[i].fails = 0;

　　}

　　並返回錯誤碼給nginx,nginx得到此錯誤碼後，就不再向後臺server發請求，而是在nginx的錯誤日誌中輸出“nolive upstreams while connecting toupstream”的記錄（這就是nolive產生的真正原因），並直接返回給請求的客戶端一個502的錯誤。

　　2.2.3當找到一個有效的server後，令該server的current_weight減一，然後，nginx就會嘗試與該server建立連接。假如成功建立連接，跳轉到2.2.4;否則跳轉到2.2..3.1

　　2.2..3.1假如nginx在等待了proxy_connect_timeout所設置的時間段後（如3秒），連接仍然沒有建立成功，nginx就在錯誤日誌中輸出“upstreamtimed out (110: Connection timed out) while connecting toupstream”的記錄（這就是timedout（連接超時）產生的真正原因）.

　　 2.2.3 .2接着，讓當前server的失敗次數加一（peer->fails++;假如該server最大失敗次達到最大失敗次數，將在一段時間內該server是無效的），假如當前nginx與後臺服務器的嘗試次數沒有達到upstream中server的總個數，重新跳轉到2.2.2,輪循下一個server,繼續嘗試。假如達到最大嘗試次數，就表示uptream中所有的server都嘗試了一遍，沒有server可以提供服務，返回一個504的錯誤給客戶端。

　　2.2.4 當nginx與server建立連接成功後，假如server響應請求，把處理結果返回給nginx,

　　跳轉到2.2.5; 否則跳轉到2.2.4.1

　　2.2.4.1假如nginx在等待了proxy_read_timeout所設置的時間段後（如30秒），server仍然沒有對nginx發送來的請求作出響應，nginx就在錯誤日誌中輸出“upstreamtimed out (110: Connection timed out)while readingresponse header fromupstream”的記錄（這就是timedout（讀超時）產生的真正原因）.

　　 2.2.4.2接着，讓當前server的失敗次數加一（peer->fails++;假如該server最大失敗次達到最大失敗次數，將在一段時間內該server是無效的），假如當前nginx與後臺服務器的嘗試次數沒有達到upstream中server的總個數，重新跳轉到2.2.2,輪循下一個server,繼續嘗試。假如達到最大嘗試次數，就表示uptream中所有的server都嘗試了一遍，沒有server可以提供服務，返回一個504的錯誤給客戶端。

　　2.2.5Nginx收到後臺server傳送過來的結果後，就會返回給客戶端一個200的正確結果。這樣，nginx作爲反向代理的功能也就完成了。

　　三、Ip_hash策略

　　3.1 Ip_hash和RR 的策略有兩點不同在於：

　　當一個客戶請求到nginx後，

　　1）nginx如何選擇一個最初的server,

　　2）以及當前選擇的server不能提供服務時，如何選擇下一個server.

　　3.2 RR策略回顧

　　從第二部分對RR的先容中，我們知道：

　　當一個客戶請求到達後，RR策略是從upstream的所有server中選擇一個當前權重（current_weight）最大的server作爲最初的server.

　　upstream的所有server是按照由高到低排序後存儲在一個peers數組中，當最初選擇的server不能提供服務時，RR策略就會選擇peers數組中的下一個元素作爲當前server，繼續嘗試，假如已經達到數組的最大元素，就會從第一個元素再輪循。

　　3.3 ip_hash策略先容

　　在ip_hash策略中，它選擇最初的server的方法是根據請求客戶真個IP計算出一個哈希值，再根據哈希值選擇後臺的服務器。

　　1）由IP計算哈希值的算法如下，其中公式中hash初始值爲89，iphp->addr[i]表示客戶真個IP，通過三次哈希計算得出一個IP的哈希值：

　　for (i = 0; i < 3; i++) {

　　hash = (hash * 113 + iphp->addr[i]) % 6271;

　　}

　　2）在選擇下一個server時，ip_hash的選擇策略是這樣的：

　　它在上一次哈希值的基礎上，再次哈希，就會得到一個全新的哈希值，再根據哈希值選擇另外一個後臺的服務器。

　　哈希算法仍然是

　　for (i = 0; i < 3; i++) {

　　hash = (hash * 113 + iphp->addr[i]) % 6271;

　　}在這種ip_hash策略，假如一個後臺服務器不能提供提服務（連接超時或讀超時），該服務器的失敗次數就會加一，當一個服務器的失敗次數達到max_fails所設置的值，就會在fail_timeout所設置的時間段內不能對外提供服務，這點和RR是一致的。

　　假如當前server不能提供服務，就會根據當前的哈希值再哈希出一個新哈希值，選擇另一個服務器繼續嘗試，嘗試的最大次是upstream中server的個數，假如serwin7ver的個數超過20，也就是要最大嘗試次數在20次以上，當嘗試次數達到20次，仍然找不到一個合適的服務器，ip_hah策略不再嘗試ip哈希值來選擇server,而在剩餘的嘗試中，它會轉而使用RR的策略，使用輪循的方法，選擇新的server。

　　3）除了以上部分不同外，IP_hash的其餘部分和RR完全一樣，由於它的其餘部分功能的實現都是通過調用RR中的函數。

　　4）IP_hash上風是把同一個客戶IP的請求分配給同一個後臺服務器。

Jimy

發佈了11 篇原創文章 · 獲贊 1 · 訪問量 8萬+

私信關注

nginx負載均衡中RR和ip_hash策略分析

測試人員都是畫畫大神，讓我看看誰還不會用代碼圖？

Object.values()對象遍歷

linux配置sftp服務器

html 5中幾個不容錯過的api

MYSQL常用命令

nginx負載均衡中RR和ip_hash策略分析

ubuntu下設置Nginx自啓動

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結