企業全方位容災

企業全方位容災
2007-01-16 18:26:56

爲了保護數據安全和提高數據的持續可用性,企業要從RAID保護、冗餘結構、數據備份、故障預警等多方面考慮。對於關鍵業務應用,如電信計費系統、銀行營業系統等,則要採用異地容災的保護措施。應該說,容災是數據安全性和業務連續性的最高保護級別。在系統設計中,企業一般會考慮做數據備份和採用主機集羣的結構, 因爲它們能解決本地數據的安全性和可用性。數據存放在一個地方總存在風險,況且人爲的邏輯錯誤也有可能破壞數據,因而,可以採用高性能、完善的備份系統,將數據拷貝下來,存放到價廉的存儲介質上,這是數據安全的基本保證。企業最常使用的備份介質包括:磁盤、光盤塔和磁帶庫等。同時,在系統或應用出現故障時,爲了保證本地業務的不中斷運行,主機集羣是一個較好的方案。
  現在,隨着企業對數據可用性認識的加深,關鍵業務不允許出現哪怕是1%的災難威脅,因而,異地容災已成爲數據可用性解決方案的重要組成部分。異地容災系統提供一個遠程的應用備份現場,能有效地防止因本地毀滅性災難(地震、火災、水災等)引起的數據丟失,預防場地問題帶來的數據不可用性。這些場地問題包括:電力中斷、電信中斷、自然災難和場地遷移等。作爲企業的關鍵業務,任何原因造成的業務中斷都將影響其經濟收入,降低市場分額,丟失客戶,甚至造成企業破產。容災系統將這種“場地”故障造成的數據不可用性減到最小。當災難發生時,容災系統能保證企業數據的安全和業務的連續性,具體表現在:數據在遠程場地存有一致、可用的拷貝;應用立即在遠程現場運行。因此,容災方案的核心是兩個關鍵技術:數據容災(即數據複製)和應用的遠程切換(即發生災難時,應用可以很快在異地切換)。其中,數據容災與應用切換不能截然分開,應用切換應該以數據容災爲基礎。
  
做好數據複製工作
  數據複製,是指將關鍵信息(數據和環境)安全、一致、實時地存放到容災現場。實際上,從一個服務器到另一個服務器的數據複製,有很多方式可以完成。傳統的方式一般採用磁帶傳送的技術分發數據。現在,企業的部分運作完全建立在電子商務基礎上,對數據立即存取的要求越來越高,由於磁帶不支持數據立即存取的運行模式,取而代之的是在線數據複製技術。
  數據複製一般有兩種基本的策略來取得:一種是存儲複製,即批量地將文件或數據塊從一臺服務器傳送到另一臺或多臺服務器,存儲複製獨立於應用,這意味着運行在單臺服務器上的多個應用的數據可以同時複製到備用服務器上。另一種是應用級複製,即複製是與應用相關的,如數據庫或Web 分別採用不同的複製方法,這種複製在交易級(表或行)完成。如果有多個應用在同一個服務器上,則各自採用自己的複製技術。
點擊在新窗口查看全圖
容災方式與獲益
  實現存儲複製有兩個方式:一是基於主機的數據複製;二是基於存儲設備的數據複製。
  基於主機系統的數據複製,主要以軟件的形式進行數據複製。例如:各數據庫廠商目前在數據庫軟件中都提供一些數據分發的功能,如Veritas、Legato等公司的軟件,在操作系統之上與數據庫有接口,操作系統上某些文件的複製,可把數據定期地、在線地複製到目的地的機器上。這種方式的優點是,與應用(尤其數據庫應用)結合較緊,在數據一致性、完整性上保證較好,與數據庫的日誌文件基本一致。而且,採用軟件數據複製方式具有配置靈活、價格低、高性能等特徵。其缺點是主機上資源佔用太大,複製的壓力太大。一個大型系統,如果既要保證系統能正常運行,又要做大量的複製和備份工作,成本太高,而且沒有這樣的同步方案。因爲任何一筆交易,要把它實時地發送到遠程站點,都不能做到同步,只能做到異步,即定期地把累積數據成批發送。然而,對數據庫應用來說,異步不能保證數據庫的一致性,容易造成數據庫癱瘓。
  基於存儲設備的數據複製,即智能存儲系統的遠程鏡像,屬於企業級存儲系統功能,這種數據複製在存儲系統內部實現,與主機無關。這樣做的好處是:在主機上的資源佔用很小,能在業務運行需要的情況下,保持I/O的響應。其問題是:首先,受通信鏈路的通信條件影響大,由於關係到每個I/O的響應時間,如果條件不好,帶寬不夠,則只能異步;其次,此種存儲複製通常價格昂貴,需要許多專用硬件,而且這種複製只能在同種陣列間進行。
  對於企業而言,選擇基於主機的數據複製還是選擇基於存儲的數據複製,主要取決於企業的規模和對業務關鍵程度。當業務主要在企業級或數據中心級時,應該選用高端的基於存儲設備的數據複製,基於存儲系統的複製與用軟件複製相比,實現效果要好得多,因爲通過硬件實現複製,效果能得到充分保證,這是因爲:若出現突然中斷的情況,無論同步和異步,因爲部分數據放在主機的緩存中,因而可能會丟失。不過,基於存儲復製造成的數據丟失,不會造成數據庫的癱瘓,因爲當有一部分信息沒有寫入的時候,相應的也會丟掉一些關連性的交易數據,不會出現數據的不一致性。所以,丟失的一部分數據對真正出現的災難來說,在一定範圍內是可以承受的。而在一些中、低端應用中,一些成本預算較緊的應用,可以考慮當主機資源不是瓶頸時,通過軟件完成數據複製。目前,能夠提供基於存儲設備的數據複製的產品有:EMC公司的Symmetrix的SRDF、CLARiiON、MirrorView,IBM公司ESS的PPRC、HDS的Remote Copy等。能夠提供基於主機的數據複製的產品包括:Veritas公司的Replicator和SUN公司的Data Replicator等。
  
遠程切換不可少
  容災系統的最終目的是提高應用和數據的高可用性,保證即使數據中心現場災難的情況下,關鍵業務停機時間最短。因而,在數據複製已保證了遠程現場數據一致性的情況下,還需要應用切換,即使關鍵業務能夠在異地及時地切換過去,在備份中心儘快地工作。
  對整個容災系統而言,只有數據複製並不是完整的容災,如果沒有應用切換,容災就不能真正地完成。目前,應用切換主要通過軟件實現。能夠提供實現應用切換功能的廠商包括:Veritas、Legato、IBM等公司。
  
統籌規劃容災
  對企業而言,當系統宕機時,影響是全面的。平均來說,公司面臨宕機的機率約爲每個局域網絡每年有七次。因此,在災難後恢復到適當的服務水準所需的時間十分關鍵。平均來說,災難後至少需要二到四天的時間,系統才能復原,當局域網的使用者停止工作時,損失將十分驚人。
  提前規劃
  一個有實力、有遠見的企業,應該在構建其信息基礎結構時,把容災考慮進來。在規劃企業的IT系統時,一定要預見到,或者說要爲新功能的引入打好基礎結構,爲今後整個IT系統的可擴展打好基礎。如果企業目前暫時不上容災系統,但未來可能要考慮到容災,則一定要注意,儘可能地將數據集中化管理,這是容災的一個前提。
  足夠的帶寬
  此外,由於容災主要採用集中的網絡備份,備份數據量非常大,大大消耗並影響了業務系統的運行,因而企業最好要有百兆以上的帶寬。
  完整的容災
  容災應該是一個完整的系統,包括容災的功能軟件和容災硬件設備,從前端的應用到後臺的數據庫等,都需要全面的容災。其中,硬件設備包括存儲設備、遠程連接設備(從生產中心到備份中心的連接)和主機設備;功能軟件包括數據複製軟件和應用切換軟件。
  平時做好備份
  因爲平時可靠的數據備份是容災的前提,因此,平時應定時、定點、定期地做好數據備份工作。
  重視防病毒
  局域網絡系統很容易受到外界各種毀壞因素的影響,電腦病毒是潛在的威脅,未消除的電腦病毒很可能會對組織造成巨大的傷害,絲毫不比火災或地震遜色,它會讓企業磁盤中的數據無法使用。因此,企業應重視預防病毒。
 
發佈了41 篇原創文章 · 獲贊 0 · 訪問量 12萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章