高可用的實現——LVS

Linux Virtual Server

幾個術語:
Director:也可以稱爲調度器,LVS前端設備;

realserver:也稱爲真實內部服務器,是真正在提供服務的;

VIP:對外公佈的IP,即客戶請求進來的IP地址;

DIP:調度器和realserver之間通信的地址;

LVS工作模式介紹

LVS實現服務器集羣負載均衡有三種方式,NAT,DR和TUN,下面簡單談談這三種方式的區別:

LVS-NAT:
這個方法的思路是實施網絡層(IP層)數據欺騙,它把客戶端發送到redirector數據IP包的目標地址進行了替換。
1、網絡環境
一臺director + N臺realserver,director和realserver在同一個私有網段,director是realserver的默認網關。只有director擁有公共IP,可以暴露在廣域網上。

2、客戶端請求
客戶端請求先到公用IP(director),請求報文中的IP包目標地址被替換成了一個director據負載均衡策略選擇的一個realserver的IP。

3、realserver響應
realserver處理完請求生成了返回數據包,返回數據IP包的源地址是realserver的IP地址,目標地址是客戶服務端IP地址。由於realserver的默認網關是redirector,因此儘管返回IP數據包的目標地址是客戶端的ip地址,返回數據包仍然首先被髮回到redirector上。redirector再次實施欺騙,把返回的IP 數據包的源地址改成自己的IP。然後再轉發到交換機上返回給客戶端。
整個過程redirector的任務是實施了2次IP層欺騙修改,一次是修改了請求數據包得目標地址,這次修改的目的是爲了實現數據的負載均衡的分發。另一次是修改了響應數據包的源地址,目的是爲了隱藏realserver,使用戶感覺不到realserver的存在。

3、限制:整個集羣的吞吐量受到redirector的帶寬限制(主要是出口帶寬)。


LVS-DR:
這個方法的思路是實施數據鏈路層數據欺騙,修改網絡幀數據的Mac地址。
1、網絡環境
一臺director + N臺realserver,director和realserver都擁有公共IP,都暴露在廣域網上,此外realserver還有一個和director ip地址一樣的ip別名。
也就是說realserver有2個ip,一個真實的ip地址,一個和direcotr地址一樣的IP別名(即公用IP),公用IP就是開放給客戶端訪問的IP地址。
realserver還需要做一個配置,使它們忽略所有的針對公用IP的ARP廣播,當系統arp廣播詢問哪個mac地址擁有公用IP時,就只有調度服務器會響應,外界發送的數據就不會發給實際服務器。

2、客戶端請求
客戶端請求先到公用IP(director),由於網絡環境已配置爲只有director響應過ARP廣播,因此請求報文的mac地址會被改爲realserver的mac地址。
也就是說redirector實施鏈路層欺騙,將幀數據的目標mac地址替換成根據負載均衡策略決定的某一realserver的mac地址。

3、realserver響應
realserver收到mac幀,然後將mac幀組裝成ip包,發現ip包中的目標地址和自己的ip別名相同,沒有問題,繼續處理,(這就是要求ip別名相同的原因,如果不同,操作系統可能會直接忽略)生成響應數據,發送回去。這時候由於redirector不是默認網關,因此這些數據會直接發到廣域網上,廣域網會把數據送到客戶端。

4、優點:返回數據包無需經過redirector,沒有redirector帶寬瓶頸。原則上集羣的帶寬是所有實際服務器帶寬之和,當然他們不可能超過連接的廣域網交換機的帶寬。

5、限制:需要購買多個公共IP,director和realserver必須在同一個 WAN網段,也就是要在同一個交換機上。
爲什麼一定要在同一網段呢?很簡單,如果realserver在另外一個網段,redirector把整個數據包和mac幀修改完之後再發送到交換機上,交換機發現自己的wan內找不到這個mac地址,無法進行轉發。

LVS-TUN:
這個方法是爲了突破LVS-DR同一網段內的限制所提出來的。它不做任何欺騙,而是光明正大的交流,在網絡層進行了二次包裝。

1、網絡環境
一臺director + N臺realserver,director 和realserver都擁有公共IP,都暴露在廣域網上。公共ip互不相同,沒有別名限制,也無需在同一網段。

2、客戶端請求
客戶端發送數據到redirector,redirector把IP包作爲有效負載放到一個新的IP包中去,並根據調度策略確定一個特定realserver的ip作爲新的IP包得目的地址。這些新的IP包完全符合網絡協議,也沒有任何欺騙的勾當,因此這些ip包光明正大得穿過wan網段,達到指定的realserver。

3、realserver響應
realserver拿到數據後,它需要做一個事情,把ip包的有效載荷提取出來,然後把這些載荷再作爲ip包組成TCP,再向上組成最後的請求數據。根據請求數據,realserver生成返回數據後,光明正大返回給客戶端。

4、優點:和LVS-DR一樣,沒有redirector出口帶寬瓶頸。

5、缺點:需要額外的打包和解包,有一定的開銷。




LVS配置
LVS-NAT的配置
1、realserver配置要求:

配置內部私網地址,默認網關指向調度服務器

2、Directer配置要求 基本配置:

調度服務器需要2塊網卡(一塊網卡對外,一塊網卡對內。1塊也可以,配置子接口,對外的VIP和DIP都配置在同一網卡上,不過這樣會更加的降低調度器的性能,建議還是雙網卡)

關閉selinux和iptables

setenforce 0

service iptables stop

(爲了避免不必要的麻煩,在每臺服務器上都關閉這2個服務)

打開包轉發功能

echo "1" > /proc/sys/net/ipv4/ip_forward

ipvsadm -A –t $VIP:$Port-s rr

解釋:-A表示添加一個集羣服務(可以添加多個,比如添加一個web的80和一個https的443);-t表示是tcp協議;-s表示調度算法是輪詢(一共有10種調度算法,可以按照自己實際需要選擇)

ipvsadm -a –t $VIP:$Port -r $DIP:$Port-m

解釋:-a表示添加一個realserver,後面跟上之前定義的集羣服務的地址端口,-r表示增加具體realserver的地址,-m表示模式爲NAT模式


LVS-DR的配置

1、Realserver配置要求 基本配置

首先先配置限制arp,不然等配置好地址後就產生地址衝突了,通過修改內核參數來實現。

在linux中 ,默認在接口上通告所有接口上IP的arp廣播,在接口上應答所有接口上IP的arp請求

arp_announce 限制arp通告

限制等級

0:在接口上通告所有接口上IP的arp廣播

1:對於其它設備的arp請求,在接口上儘量限制廣播通告應答(不夠嚴格)

2:只通告本接口上IP的arp廣播

arp_ignore 限制arp應答

限制等級

0:對於其它設備 的arp請求,應答所有其它接口的上IP的arp應答

1:對於其它設備的arp請求,只應答本接口上IP的arp應答

echo "1" > /proc/sys/net/ipv4/conf/lo/arp_ignore

echo "2" > /proc/sys/net/ipv4/conf//lo/arp_announce

echo "1" > /proc/sys/net/ipv4/conf/all/arp_ignore

echo "2" > /proc/sys/net/ipv4/conf/all/arp_announce


在realserver上的lo口配置VIP,這樣配置就限制了VIP不會在物理交換機上產生MAC地址表,從而避免IP衝突

ifconfig lo:1 $VIP broadcast $VIP netmask 255.255.255.255

ifconfig eth0 $DIP up

注意此VIP的接口的廣播地址仍然爲VIP,限制其廣播,子網掩碼是32位,下面調度器上的配置也注意此項

配置特殊路由,使目標爲VIP的包的以源地址爲VIP的lo口出去

route add –host $VIP dev lo:1

Directer配置要求

配置VIP和DIP,VIP配置在物理網卡的子接口上

ifconfig eth0 $DIP broadcast $VIP netmask 255.255.255.0 up

ifconfig eth0:1 $VIP broadcast $VIP netmask 255.255.255.255 up

配置特殊路由,目標是VIP的包從配置了VIP的物理子接口上出去

route add –host $VIP dev eth0:1

集羣配置

ipvsadm -A –t $VIP:$Port-s rr

解釋:-A表示添加一個集羣服務(這裏和NAT中的配置一樣)

ipvsadm -a –t $VIP:$Port -r $DIP:$Port-g

解釋:其它和NAT也差不多,在最後的模式改爲-g,即DR模式



LVS調度算法介紹:

-s 指定服務採用的算法,常用的算法參數如下:
rr 輪叫(Round Robin)
調度器通過”輪叫”調度算法將外部請求按順序輪流分配到集羣中的真實服務器上,它均等地對待每一臺服務 器,而不管服務器上實際的連接數和系統負載。

wrr 加權輪叫(Weighted Round Robin)
調度器通過”加權輪叫”調度算法根據真實服務器的不同處理能力來調度訪問請求。這樣可以保證處理能力強的服務器處理更多的訪問流量。調度器可以自動問詢真實服務器的負載情況,並動態地調整其權值。

lc 最少鏈接(Least Connections)
調度器通過”最少連接”調度算法動態地將網絡請求調度到已建立的鏈接數最少的服務器上。如果集羣系統的真實服務器具有相近的系統性能,採用”最小連接”調度算法可以較好地均衡負載。

wlc 加權最少鏈接(Weighted Least Connections)
在集羣系統中的服務器性能差異較大的情況下,調度器採用”加權最少鏈接”調度算法優化負載均衡性能,具有較高權值的服務器將承受較大比例的活動連接負載。調度器可以自動問詢真實服務器的負載情況,並動態地調整其權值。

lblc 基於局部性的最少鏈接(Locality-Based Least Connections)
“基於局部性的最少鏈接”調度算法是針對目標IP地址的負載均衡,目前主要用於Cache集羣系統。該算法根據請求的目標IP地址找出該目標IP地址最近使用的服務器,若該服務器是可用的且沒有超載,將請求發送到該服務器;若服務器不存在,或者該服務器超載且有服務器處於一半的工作負載,則用”最少鏈接” 的原則選出一個可用的服務器,將請求發送到該服務器。

lblcr 帶複製的基於局部性最少鏈接(Locality-Based Least Connections with Replication)
”帶複製的基於局部性最少鏈接”調度算法也是針對目標IP地址的負載均衡,目前主要用於Cache集羣系統。它與LBLC算法的不同之處是它要維護從一個目標IP地址到一組服務器的映射,而LBLC算法維護從一個目標IP地址到一臺服務器的映射。該算法根據請求的目標IP地址找出該目標IP地址對應的服務器組,按”最小連接”原則從服務器組中選出一臺服務器,若服務器沒有超載,將請求發送到該服務器,若服務器超載;則按”最小連接”原則從這個集羣中選出一臺服務器,將該服務器加入到服務器組中,將請求發送到該服務器。同時,當該服務器組有一段時間沒有被修改,將最忙的服務器從服務器組中刪除,以降低複製的程度。

dh 目標地址散列(Destination Hashing)
“目標地址散列”調度算法根據請求的目標IP地址,作爲散列鍵(Hash Key)從靜態分配的散列表找出對應的服務器,若該服務器是可用的且未超載,將請求發送到該服務器,否則返回空。

sh 源地址散列(Source Hashing)
“源地址散列”調度算法根據請求的源IP地址,作爲散列鍵(Hash Key)從靜態分配的散列表找出對應的服務器,若該服務器是可用的且未超載,將請求發送到該服務器,否則返回空。

























發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章