災難恢復方案設計的關鍵步驟(轉貼)

對於一個企業來說,災難發生過後,最嚴重的問題不是來自於如何從磁帶中將數據恢復出來,而是來自於:
1、缺乏、甚或完全沒有文檔化的恢復計劃和措施;
2、在重新配置硬件的時候,找不到原始系統配置和設置的文檔;
3、磁帶文檔、歸檔和跟蹤相關資料的缺失,或者不完整的磁帶歸檔策略;
4、對部門級的服務器保護不夠充分。

#1 – 文檔化並歸檔系統配置
成功的業務應用和數據恢復,始於完整的系統配置記錄文檔,包括隨着時間的推延,系統配置被改變的日誌記錄。一旦這些文檔被創建,至少要有一個副本必須被存放在異地,以防本地的文檔及其副本被損壞或毀壞。
創建文檔,並在異地將文檔進行歸檔,是快速並有效地重建系統的關鍵步驟。如果有一個可以進行裸設備恢復的方案,能夠往磁盤上直接加載所記錄的系統配置,爲新設備提供自動重建,將會爲關鍵應用服務器的重建提供更高的價值。

#2 – 文檔化並歸檔災難恢復的程序
爲了確保業務的成功恢復,必須建立一個簡捷-有效的災難恢復程序,以及嚴格按照既定的程序去建立文檔、並與業務關鍵數據一起安全地異地保存。這樣可以避免“摸着石頭過河”的反覆的恢復測試。

#3 – 安全措施、文檔及磁帶介質跟蹤
針對業務災難偶發事件的成功計劃,應包括異地存放磁帶、及記錄其磁帶內容的文檔的策略和程序。如果沒有這些記錄磁帶內容的文檔,在恢復時就要化大量的時間來索引和閱讀這些磁帶,以尋找藏於其中的重要數據。這樣會大大地延誤系統和數據的恢復。
根據業務需要來決定磁帶異地存放的頻率;磁帶內容必須建檔;文檔必須是安全地和易於取出地作異地保存;同時,磁帶必須是被跟蹤的。
所有這些步驟對於數據的安全保護和確保有效恢復來說,都是必須的。

#4 – 判別和保護所有業務關鍵的服務器
爲了業務的不間斷,所有運行着業務關鍵應用的部門級服務器,包括email服務器、小型數據庫服務器、及其他運行着特別應用的服務器,與數據中心的基礎設施一樣,必須被迅速恢復。
可悲的是,在大多數個案中,企業並沒有考慮對這些系統的保護。而事實上,這些部分應該與企業數據中心完全一樣,在同一計劃中文檔化其保護程序和實施。
任何正在使用中的服務器,以及每一臺臺式機和便攜機系統,從某種意義上來說都是值得保護的。最基本的數據保護可保證某種程度上的恢復。進一步而言,裸設備恢復的方案可以確保以最少的工夫和經驗來恢復和重建關鍵應用服務器,而且只需要少量的跟蹤裸設備恢復磁盤本身的文檔。

#5 – 在線數據保護更利於恢復
在線數據保護是數據磁帶保護的重要補充,能夠在從災難中恢復的過程中,尤爲關鍵地確保業務運行。要想能夠在災難發生後數小時內恢復業務,必須要有一個在線的、異地的生產數據的可用的副本。只要有這樣的第二、第三個副本,數據通過網絡以寫入的速度傳送到異地的存儲設備上,依靠無論是嵌入在存儲硬件中、還是掛接在存儲服務器上運行的複製技術,可以維持中斷在數分鐘內恢復運行。由於這些數據是實時和在線的,對業務主機重定向運行來說是即時可用的。這種方法可將業務運行與災難發生的區域分開,在較低的壓力下,從容地重建數據中心及其業務操作。

可以確保持續監控、數據連貫性和可用性的自動化工具是至關重要的,通過從大量災難事件中所獲得的重要經驗,我們認爲上述手段可以保護企業的業務運行得更好。

成功的恢復
爲了更好地應對任何災難,確保成功的恢復,業務運行需要一個包括策略、程序和相關技術結合的數據保護計劃。除了經典的數據備份技術之外,保證迅速恢復、避免恢復時“臨急抱佛腳”的解決方案包括:
*包括磁帶跟蹤技術在內的介質管理方案,
*裸設備恢復的解決方案
*實時的數據複製方案
*廣域的集羣技術方案
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章