實戰教程:如何建立雙機熱備系統

  實戰教程:如何建立雙機熱備系統

    筆者是一名醫院的網管,而醫院的軟件系統要求能夠做到一週7×24小時工作,對於整個系統的核心服務器來說如果死機後果是災難性的。所以採用網絡服務器容錯技術來保障計算機系統的可靠性是件大事!我們採用的是雙機熱備技術!相對於其它更高成本的容錯技術來說,這是最經濟且卓有成效的技術。

  硬件準備

  1.安裝前檢查

  服務器0102兩臺(面板有標示),陣列櫃1臺,雙機互聯線1(藍色),陣列櫃電源線2根,服務器電源線2根,SCSI數據連接線2根。

  2.陣列櫃安裝事項

  先連接SCSI數據線,一頭接陣列櫃後方數據接口,一頭接服務器上方非集成接口(服務器接口有兩個,一個是主板集成,一個是非集成,非集成的在服務器背部上方),再分別將電源線兩根接陣列櫃後方風扇口一側,扣好搭扣。

  3.網卡連接注意事項

  藍色網線是雙機互聯用的,一頭插在01服務器非集成網卡上(位置在服務器背部上方),另一頭插在02服務器上(位置同上)。業務用的網線一頭插在服務器集成網卡上(位置在服務器中下方,兩臺都一樣),另外一頭插在交換機上,0102都是這樣安裝,安裝後效果如圖1

 

  圖1

  4.開機順序

  先開陣列櫃,直到看到上面出現英文提示“Startup Completed”後再開服務器01,直到出現登錄窗口再開服務器02,到服務器02出現登錄窗口後,雙機開機過程結束。

  關機:先關服務器02,直到電源完全關閉。再關服務器01,直到電源完全關閉,最後按陣列櫃電源開關,則陣列櫃關閉。

  切記:

  1.不能雙機同時讀寫文件到陣列櫃相同分區,否則可能會造成文件或分區損壞。

  2.先保證服務器關機後方可關閉陣列櫃,不然會造成陣列櫃內數據丟失。

  3.一定要配置UPS,嚴防停電事故發生。

  小知識 什麼是雙機容錯?

  雙機容錯是通過雙機容錯軟件在兩臺服務器之間建立一種容錯機制,當其中一臺服務器出現故障而不能勝任工作時,自動切換到另一臺服務器。客戶端不知道也不用知道目前是由哪一個服務器在做相應的工作。由於醫院的軟件是基於Windows 2000 Server+SQL實現的,所以雙機容錯系統的處理核心是通過互相監控的NT服務程序來實現的,雙機容錯系統是完全獨立於NT的應用軟件和硬件設備。

  軟件使用

  雙機容錯的核心是雙機熱備軟件通過互相監控來實現熱備的效果。我們採用的軟件是美國ROSE數據公司的ROSE HAROSE HA可及時地進行錯誤隔絕、恢復,保證服務器在出現意外及有計劃的停機情況下均能爲客戶提供連續有效的服務。將ROSE HA軟件同時安裝在兩臺服務器上,用於監視系統的狀態,協調兩臺服務器的工作,維護系統的可用性。

  將軟件分別安裝在0102服務器上,並輸入正確的授權號。它的安裝很簡單,一路“Next”即可,安裝完成後請注意,要將它的服務改爲隨系統啓動。

  注意:雙機熱備要求雙機須超級用戶密碼相同,因此超級用戶密碼爲都爲123

  服務器01爲主機,服務器02爲從機,當01出現中斷或意外不能工作時,雙機熱備軟件會自動切換到另一臺服務器即02,直到服務器01恢復,軟件會自動切換回01機。

  1.狀態顯示說明

  主界面中,兩臺PC機呈亮色,表示雙機開啓,中間綠線表示雙機心路線(即藍色網線)通訊正常,紅色表示線路有故障或雙機中有一臺無響應!雙機中屏幕有ZZZ標示的爲從機,屏幕中有圖標的是主機(2)。主機工作時能看到陣列櫃分區,即GH盤。從機不能看到這兩個分區。

  

  圖2

  2.資源界面說明

  圖3所示server01(01)server02(02)兩邊現在已經建立好了相應的同步資源,它們是IP地址、服務器名、NT服務、共享文件和磁盤卷。現在分別列出相關信息:資源工作狀況說明,呈現亮色的爲主機資源,綠色的爲從機資源,黃色驚歎號的表示該資源有異常(如主機死機,從機就會顯示此信息)。灰色表示資源剛建立但未激活。原則上兩邊的資源名稱和數量是相同的,陣列櫃資源必須全部包含在內。

  

 

  圖3

  其中server表示虛擬服務器,它是由雙機熱備軟件自動產生的PC機。

  server的特性基本與主機相同,如輸入\server\c$,可以訪問的是server01C盤,但它使用自己的IP地址,共享目錄也是自己的,如\server\test能夠訪問的前提是server01server02都創建了test目錄共享,且兩個共享是指向同一個目錄,如G:\test,而不能建立在各自的獨有盤符中,要建立在公用盤符(一般是陣列櫃)上。當雙機的共享都建立成功後,再使用雙機軟件創建一個虛擬共享資源如\server\test即可。

  開設用戶名爲管理用賬號“toway”,密碼“toway”,如果新賬號要求在server01中進行,它是主域控制器。數據庫用戶名system / twsa2004_comein. (注意後面有小數點)

  出現意外時的處理方法

  1.雙機配置時

  雙機熱備程序已經備份了註冊表文件,分別對應在各自機器的 administrator\我的文檔中文件名爲01.reg02.reg,恢復時先停止雙機服務,步驟爲:進雙機軟件,點擊快捷菜單中的紅色圖標,依次點→Tools→Restore cluster configur01tion,選中相應的備份文件即可。

  2.資源丟失,如陣列櫃盤符消失

  先停止雙機服務,再分別在雙機中使用磁盤管理器加入相應盤符,保證雙機盤符相同再重啓雙機服務,點擊失效的資源(一般呈灰色),右鍵選擇“bring in cluster”,稍後即會恢復正常。

  3.切換服務器的主從順序

  點擊需要停止機器名,進入菜單選擇resource→server f01ilover

  4.意外停電事故的處理

  如果遇到意外停電事故,可能會產生陣列櫃分區丟失,雙機不能正常工作的情況。請按下面的方式處理:

  1)先停止雙機服務。

  2)使用磁盤管理器加入相應盤符,看此時是哪個盤符丟失,直接點擊盤符在右鍵菜單中選擇更改驅動器名和路徑,分配原來正確的路徑即可。

  3)重啓服務器01,在我的電腦中查看陣列櫃盤符是否已經出現,裏面的內容是否還有。由於相關的備份內容已經全部拷貝到01機的EF盤中,主要是mssqlservertoway3個關鍵目錄。如果損壞嚴重,可以用備份進行拷貝來恢復。不過最好是重啓後仔細觀察,不要輕易進行拷貝恢復,因爲可能會丟失一些數據!

  一般來說,G 盤存放mssql(SQL安裝路徑)server(程序共享路徑)towayhis(數據庫日誌)等文件夾,H 盤放數據庫的目錄和towayhis (數據庫文件)文件夾。

  重啓服務器01後,將服務器02也重啓一遍,查看陣列櫃分區是否正常。

  4)如果一切正常就可以啓動雙機程序,把服務恢復。檢查資源窗口中的狀態是否正常,如果呈現灰色,一般是陣列櫃的盤符,可以手工啓動它,啓動方法是右鍵點擊盤符選擇“bring in”即可。

  提示:雙機程序可以手工切換指定誰爲主機,默認是01,如果想改爲02,在資源界面中選中01機,再點擊快捷菜單中“?”左邊的第一個按鈕即可。切換後原來的01機資源呈現綠色 ,02機資源呈現亮色,即表示切換成功!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章