Apache tomcat7.0集羣配置


一、前言

在單一的服務器上執行WEB應用程序有一些重大的問題,當網站成功建成並開始接受大量請求時,單一服務器終究無法滿足需要處理的負荷量,所以就有點顯得有點力不從心了。另外一個常見的問題是會產生單點故障,如果該服務器壞掉,那麼網站就立刻無法運作了。不論是因爲要有較佳的擴充性還是容錯能力,我們都會想在一臺以上的服務器計算機上執行WEB應用程序。所以,這時候我們就需要用到集羣這一門技術了。

在進入集羣系統架構探討之前,先定義一些專門術語:

1. 集羣(Cluster):是一組獨立的計算機系統構成一個鬆耦合的多處理器系統,它們之間通過網絡實現進程間的通信。應用程序可以通過網絡共享內存進行消息傳送,實現分佈式計算機。

2. 負載均衡(Load Balance):先得從集羣講起,集羣就是一組連在一起的計算機,從外部看它是一個系統,各節點可以是不同的操作系統或不同硬件構成的計算機。如一個提供Web服務的集羣,對外界來看是一個大Web服務器。不過集羣的節點也可以單獨提供服務。

3. 特點:在現有網絡結構之上,負載均衡提供了一種廉價有效的方法擴展服務器帶寬和增加吞吐量,加強網絡數據處理能力,提高網絡的靈活性和可用性。集羣系統(Cluster)主要解決下面幾個問題:
高可靠性(HA):利用集羣管理軟件,當主服務器故障時,備份服務器能夠自動接管主服務器的工作,並及時切換過去,以實現對用戶的不間斷服務。
高性能計算(HP):即充分利用集羣中的每一臺計算機的資源,實現複雜運算的並行處理,通常用於科學計算領域,比如基因分析,化學分析等。
負載平衡:即把負載壓力根據某種算法合理分配到集羣中的每一臺計算機上,以減輕主服務器的壓力,降低對主服務器的硬件和軟件要求。

總體來說,在負載均衡的思路下,多臺服務器爲對等方式,每臺服務器都具有同等的地位,可以單獨對外提供服務而無須其他服務器的輔助。通過負載分擔技術,將外部發送來的請求按一定規則分配到對稱結構中的某一臺服務器上,而接收到請求的服務器都獨立迴應客戶機的請求。

提供服務的一組服務器組成了一個應用服務器集羣(cluster),集羣下的對等多機環境可以增加系統的併發處理能力,和單臺機器出現故障系統的錯誤冗餘能力;同時實現了負載均衡和系統高可靠性。

二、常用負載均衡技術

1. 基於DNS的負載均衡

通過DNS服務中的隨機名字解析來實現負載均衡,在DNS服務器中,可以爲多個不同的地址配置同一個名字,而最終查詢這個名字的客戶機將在解析這個名字時得到其中一個地址。因此,對於同一個名字,不同的客戶機會得到不同的地址,他們也就訪問不同地址上的Web服務器,從而達到負載均衡的目的。

2. 反向代理負載均衡 (如Apache+JK2+Tomcat這種組合)

使用代理服務器可以將請求轉發給內部的Web服務器,讓代理服務器將請求均勻地轉發給多臺內部Web服務器之一上,從而達到負載均衡的目的。這種代理方式與普通的代理方式有所不同,標準代理方式是客戶使用代理訪問多個外部Web服務器,而這種代理方式是多個客戶使用它訪問內部Web服務器,因此也被稱爲反向代理模式。

3. 基於NAT(Network Address Translation)的負載均衡技術 (如Linux Virtual Server,簡稱LVS)

網絡地址轉換爲在內部地址和外部地址之間進行轉換,以便具備內部地址的計算機能訪問外部網絡,而當外部網絡中的計算機訪問地址轉換網關擁有的某一外部地址時,地址轉換網關能將其轉發到一個映射的內部地址上。因此如果地址轉換網關能將每個連接均勻轉換爲不同的內部服務器地址,此後外部網絡中的計算機就各自與自己轉換得到的地址上服務器進行通信,從而達到負載分擔的目的。

三、Apache+JK2實現Tomcat集羣與負載均衡

客戶系統一般採用Apache httpd作爲web服務器,即作爲Tomcat的前端處理器,根據具體情況而定,有些情況下是不需要Apache httpd作爲 web 服務器的,如系統展現沒有靜態頁面那就不需要Apache httpd,那時可以直接使用Tomcat作爲web 服務器來使用。使用Apache httpd主要是它在處理靜態頁面方面的能力比Tomcat強多了。

1. 集羣實現原理

image

如上圖所示,主要通過 Apache-Server 作爲中轉服務器,實現多個 tomcat 服務器之間的分佈式處理,用戶直接請求 Apache-Server ,然後 Apache-Server 會將請求分發到具體的 tomcat-server ,之後 tomcat-server 響應客戶請求並返回結果到 Apache-Server ,最後 Apache-Server 返回結果給用戶。

2. 配置負載均衡器

文件說明:

(a) mod_jk.conf,主要定義 mod_jk 模塊的位置以及 mod_jk 模塊的連接日誌設置,還有定義 worker.properties 文件的位置。

(b) worker.properties,定義 worker 的參數,主要是連接 tomcat 主機的地址和端口信息。如果 Tomcat 與 apache 不在同一臺機器上,或者需要做多臺機器上 tomcat 的負載均衡只需要更改 workers.properties 文件中的相應定義即可。% APACHE_HOME %爲你的安裝目錄。

環境說明: 主要使用了一個 Apache Server 和兩個 Tomcat ,在同一臺電腦上進行測試。

(a) 準備軟件

Jdk1.6 下載地址: http://java.sun.com

tomcat -6.0.29 下載地址: http://jakarta.apache.org

apache_2.2.4-win32-x86-no_ssl.msi 下載地址: http://httpd.apache.org/download.cgi

mod_jk-1.2.31-httpd-2.0.52.so ( 主要作用是建立 Apache Server 與 Tomcat 之間的連接 )下載地址: http://www.apache.org/dist/tomcat/tomcat-connectors/jk/binaries/

說明: apache-server 安裝完成後,可以在瀏覽器中輸入 http://localhost/ 來測試,如果出現 ” It works!” 則表示安裝成功。

(b) 安裝 mod_jk 連接模塊

安裝好 Jdk 、 tomcat 、 apache 後 , 加入 mod_jk 連接模塊,就是把 mod_jk- 1.2.31 -httpd-2.2.3.so 文件拷貝到% APACHE_HOME % \modules 下,把 jk 模塊的配置放到單獨的文件中來,在% APACHE_HOME % \conf 目錄新建 mod_jk.conf 、 workers.properties 文件。

在 httpd.conf 最後加上

# JK module settings

Include conf/mod_jk.conf

說明:以上表示將 mod_jk.conf 配置文件包含進來

(c) 修改 mod_jk.conf 文件

爲了保持 httpd.conf 文件的簡潔,把 jk 模塊的配置放到單獨的文件中來。在 mod_jk.conf 文件中添加以下內容:

# Load mod_jk2 module

LoadModule jk_module modules/mod_jk-1.2.31-httpd-2.2.3.so

# Where to find workers.properties( 引用 workers 配置文件 )

JkWorkersFile conf/workers.properties

# Where to put jk logs(log 文件路徑 )

JkLogFile logs/mod_jk2.log

# Set the jk log level [debug/error/info](log 級別 )

JkLogLevel info

# Select the log format(log 格式 )

JkLogStampFormat "[%a %b %d %H:%M:%S %Y] "

# JkOptions indicate to send SSL KEY SIZE,

JkOptions +ForwardKeySize +ForwardURICompat -ForwardDirectories

# JkRequestLogFormat set the request format

JkRequestLogFormat "%w %V %T"

# Send JSPs for context / to worker named loadBalancer(URL 轉發配置,匹配的 URL 才轉發到 tomcat 進行處理 )

JkMount /*.jsp controller

# JkMount /*.* loadBalancer

(d) 修改 workers.properties 文件

在 workers.properties 文件中添加以下內容:

#server 列表

worker.list = controller,tomcat1,tomcat2

# tomcat1(ajp13 端口號,在tomcat下server.xml配置,默認8009)

worker.tomcat1.port=8009

#tomcat 的主機地址,如不爲本機,請填寫ip地址

worker.tomcat1.host=localhost

worker.tomcat1.type=ajp13

#server 的加權比重,值越高,分得的請求越多

worker.tomcat1.lbfactor = 1

# tomcat2

worker.tomcat2.port=9009

worker.tomcat2.host=localhost

worker.tomcat2.type=ajp13

worker.tomcat2.lbfactor = 1

# controller( 負載均衡控制器)

worker.controller.type=lb

# 指定分擔請求的tomcat

worker.controller.balanced_workers=tomcat1,tomcat2

#worker.controller.sticky_session=true

說明:此文件配置了 2 個 tomcat 服務器進行負載均衡處理

(e) 修改 tomcat 配置文件 server.xml

更改其中一個的設置打開 tomcat2/conf/server.xml 文件,修改裏面所有的端口設置,將 8 改爲 9 ,如下:

(f) 編寫一個測試頁面 teat1.jsp

建立一個 test 的 web 應用,裏面新建一個 test1.jsp, 內容爲:

image

(g) 啓動服務器並進行測試

依次啓動 apache-server 、 tomcat1 、 tomcat2 ,通過 http://localhost/test/test1.jsp 訪問,查看 tomcat1 的窗口,可以看到打印了一行 "==========" ,再刷新一次, tomcat2 也打印了一條,再刷新,可以看到請求會被 tomcat1,tomcat2 輪流處理 , 實現了負載均衡

3. 集羣 (session複製 )

只配置負載均衡還不行,還要 session 複製,也就是說其中任何一個 tomcat 的添加的 session ,是要同步複製到其它 tomcat , 集羣內的 tomcat 都有相同的 session:

(a) Tomcat 配置

修改 tomcat1, tomcat2 的 server.xml 文件添加集羣內容, tomcat5.5 無需添加,只需要去掉註釋符, tomcat6.0 需要添加,內容如下:

<Cluster className="org.apache.catalina.cluster.tcp.SimpleTcpCluster"

managerClassName="org.apache.catalina.cluster.session.DeltaManager"

expireSessionsOnShutdown="false"

useDirtyFlag="true"

notifyListenersOnReplication="true">

<Membership

className="org.apache.catalina.cluster.mcast.McastService"

mcastAddr="228.0.0.4"

mcastPort="45564"

mcastFrequency="500"

mcastDropTime="3000"/>

<Receiver

className="org.apache.catalina.cluster.tcp.ReplicationListener"

tcpListenAddress="auto"

tcpListenPort="4001"

tcpSelectorTimeout="100"

tcpThreadCount="6"/>

<Sender

className="org.apache.catalina.cluster.tcp.ReplicationTransmitter"

replicationMode="pooled"

ackTimeout="15000"

waitForAck="true"/>

<Valve className="org.apache.catalina.cluster.tcp.ReplicationValve"

filter=".*\.gif;.*\.js;.*\.jpg;.*\.png;.*\.htm;.*\.html;.*\.css;.*\.txt;"/>

<Deployer className="org.apache.catalina.cluster.deploy.FarmWarDeployer"

tempDir="/tmp/war-temp/"

deployDir="/tmp/war-deploy/"

watchDir="/tmp/war-listen/"

watchEnabled="false"/>

<ClusterListener className="org.apache.catalina.cluster.session.ClusterSessionListener"/>

</Cluster>

分別添加以上內容後,在 tomcat2 中,修改 tcpListenPort="4001" 爲 4002。

Engine 增加 jvmRoute 屬性設置, jvmRoute 的值來自於 workers.properties 文件所設置的服務器名稱。

<Engine name="Catalina" defaultHost="localhost" jvmRoute="tomcat1" >

#server 列表

worker.list = controller,tomcat1,tomcat2

(b) 添加 test.jsp 頁面

imageimage

修改 web.xml 文件,加入 <distributable/> 節點,如下所示:

image

(c) Session複製測試

測試步驟如下:

1) 啓動 apache-server 、 tomcat1 、 tomcat2

2) 訪問 http://localhost/test/test.jsp ,輸入名稱: test0001 、值: 123 並點擊“提交查詢內容”按鈕,顯示效果如下:

如上圖所示, tomcat1 創建了一個新的 session , session 中有屬性 test0001, 值爲 123

3) 關閉 tomcat1 服務器, tomcat1 端口爲 8080 ,如下圖:

4) 在頁面中再次點擊“提交查詢內容”按鈕,效果如下:

前端頁面並沒有發生改變,接下來查看後臺情況:

如圖所示,可以發現 session 已成功複製到 tomcat2 中,以此證明 tomcat 集羣已配置成功。

5) 另外來看看不關閉 tomcat1 服務器再次提交的情況

如圖所示,請求並沒有轉發到 tomcat2 服務器,而是再次轉回 tomcat1 服務器,這種情況是由於配置了 jvmRoute 所致,以個人理解,配置了此屬性後, apache-server 會根據 session 情況來進行路由,同一個 session 會轉發給同一個服務器。

6) 打開一個新的 IE 窗口,並訪問 http://localhost/test/test.jsp



新窗口的請求轉發到了 tomcat2 服務器, session 的 id 爲 DD9E6C8181653B9BCCF534FC8760B264.tomcat2 ,根據測試結果可以說明,在不發生服務器關閉的情況下,每個 session 會綁定到同一個服務器中,而不會在服務器間發生複製。

四、總結

介紹完上面的集羣技術之後,下面就基於Tomcat的集羣架構方案進行說明:

1. 用戶的網頁瀏覽器做完本地 DNS和企業授權的DNS之的請求/響應後,這時候企業授權的DNS(即21cn BOSS DNS)會給用戶本地的DNS服務器提供一個NAT請求分配器(即網關)IP。
2. NAT分配器,它會根據特定的分配算法,來決定要將連接交給哪一臺內部 Apache httpd來處理請求。大多數的NAT請求分配器提供了容錯能力:根據偵測各種WEB服務器的失效狀況,停止將請求分配給已經宕掉的服務器。並且有些分配器還可以監測到WEB服務器機器的負載情況,並將請求分配給負載最輕的服務器等等。Linux Virtual Server是一個基於Linux操作系統上執行的VS-NAT開源軟件套件,而且它有豐富的功能和良好的說明文件。商業硬件解決方案 Foundry Networks的ServerIron是目前業界公認最佳的請求分配器之一。
3. Apache httpd + Mod_JK2在這裏是作爲負載均衡器,那爲什麼要做集羣呢?如果集羣系統要具備容錯能力,以便在任何單一的硬件或軟件組件失效時還能100%可用,那麼集羣系統必須沒有單點故障之憂。所以,不能只架設一臺有mod_jk2的Apache httpd,因爲如果 httpd或mod_jk2失效了,將不會再有請求被會送交到任何一個Tomcat 實例。這種情況下,Apache httpd就是瓶勁,特別在訪問量大的網站。
4. Mod_JK2負載均衡與故障復原,決定把Apache httpd當成web服務器,而且使用mod_jk2將請求傳送給Tomcat,則可以使用mod_jk2的負載均衡與容錯功能。在集羣系統中,帶有mod_jk2的Apache httpd可以做的事情包括:

A 將請求分配至一或多個Tomcat實例上你可以在mod_jk2的workers.properties文件中,設定許多Tomcat實例,並賦於每個實例一個lb_factor值,以作爲請求分配的加權因子。
B. 偵測Tomcat實例是否失敗當Tomcat實例的連接器服務不再響應時,mod_jk2會及時偵測到,並停止將請求送給它。其他的Tomcat實例則會接受失效實例的負載。
C. 偵測Tomcat實例在失效後的何時恢復因連接器服務失效,而停止將請求分配給Tomcat實例之後,mod_jk2會週期性地檢查是否已恢復使用性,並自動將其加入現行的Tomcat實例池中。

5. Tomcat中的集羣原理是通過組播的方式進行節點的查找並使用TCP連接進行會話的複製。這裏提示一下就是,對每個請求的處理,Tomcat都會進行會話複製,複製後的會話將會慢慢變得龐大。
6. Mod_jk2同時支持會話親和和會話複製。在tomcat 5中如何實現會話親和和會話複製?把server.xml中的標籤去掉就實現會話親和,把標籤加上就實現會話複製。
7. 會話親和:就是表示來自同會話的所有請求都由相同的Tomcat 實例來處理,這種情況下,如果Tomcat實例或所執行的服務器機器失效,也會喪失Servlet的會話數據。即使在集羣系統中執行更多的Tomcat實例,也永遠不會複製會話數據。這樣是提高集羣性能的一種方案,但不具備有容錯能力了。
8. 使用會話複製,則當一個Tomcat實例宕掉時,由於至少還有另一個Tomcat實例保有一份會話狀態數據,因而數據不會喪失。但性能會有所降低。

其實無論是分佈式,數據緩存,還是負載均衡,無非就是改善網站的性能瓶頸,在網站源碼不做優化的情況下,負載均衡可以說是最直接的手段了。其實拋開這個名詞,放開了說,就是希望用戶能夠分流,也就是說把所有用戶的訪問壓力分散到多臺服務器上,也可以分散到多個tomcat裏,如果一臺服務器裝多個tomcat,那麼即使是負載均衡,性能也提高不了太多,不過可以提高穩定性,即容錯性。當其中一個主tomcat當掉,其他的tomcat也可以補上,因爲tomcat之間實現了Session共享。待tomcat服務器修復後再次啓動,就會自動拷貝所有session數據,然後加入集羣。這樣就可以不間斷的提供服務。如果要真正從本質上提升性能,必須要分佈到多臺服務器。

其實多臺服務器各配置一個tomcat也可以實現負載均衡,而且那樣的話,可以使用安裝版的tomcat,而不用是下文中的免安裝的tomcat,而且tomcat端口配置也就不用修改了。

共有 人打賞支持


 
 
 
 

 
 

 
 
 
 

 
 

 
 

粉絲 1372
博文 388
碼字總數 1483822
評論 (4)
Ctrl+Enter
  • People
  • Nature
  • Objects
  • Places
  • Symbols
People
Nature
Objects
Places
Symbols
pro_yy
1. 基於DNS的負載均衡

通過DNS服務中的隨機名字解析來實現負載均衡,在DNS服務器中,可以爲多個不同的地址配置同一個名字,而最終查詢這個名字的客戶機將在解析這個名字時得到其中一個地址。因此,對於同一個名字,不同的客戶機會得到不同的地址,他們也就訪問不同地址上的Web服務器,從而達到負載均衡的目的。
------這條不是很明白 求指教
grail
好像還沒有發完畢吧
volador

引用來自“pro_yy”的評論

1. 基於DNS的負載均衡

通過DNS服務中的隨機名字解析來實現負載均衡,在DNS服務器中,可以爲多個不同的地址配置同一個名字,而最終查詢這個名字的客戶機將在解析這個名字時得到其中一個地址。因此,對於同一個名字,不同的客戶機會得到不同的地址,他們也就訪問不同地址上的Web服務器,從而達到負載均衡的目的。
------這條不是很明白 求指教

這是dns的輪轉規則,比如一個域名對應着幾個地址:domain->{addr1,addr2,addr3},那麼當請求該域名的時候會從其對應的地址集中輪轉得到當前要使用的地址。一些郵件服務器就是這樣實現負載均衡的。
天幕
樓主,worker.controller.balance_workers 好像應該沒有d纔對
×
陶邦仁
如果覺得我的文章對您有用,請隨意打賞。您的支持將鼓勵我繼續創作!
* 金額(元)
¥1 ¥5 ¥10 ¥20 其他金額
打賞人
留言
* 支付類型
微信掃碼支付
打賞金額:
已支付成功
打賞金額:
1條新私信,查看私信»
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章