"備份/恢復"面臨的問題與解決途徑

上世紀70年代,IT革命處於萌芽階段。那時的數據量很小,通常只有幾十兆到幾百兆。當時的硬盤成本更是接近天價,每兆硬盤空間的售價超過了 3000美元,購買一個容量小於10兆的硬盤所需的費用,甚至超過了一個系統程序員全年的工資。另一方面,基於硬盤的存儲技術卻還剛剛起步。基於上述原因,當初進行備份/恢復操作時,往往採用磁帶作爲備份介質。

基於磁帶的"備份/恢復"面臨的問題

進入21世紀的海量數據時代,與30年前相比,數據量已經從幾十、幾百兆增長至幾千TB;而且由於數據備份和恢復操作幾乎是貫穿全年的例行工作(Routine Job),如果現在仍然以磁帶作爲最基本的備份介質,不僅會耗費管理員大量的時間和精力,同時也會產生諸多問題。主要表現在以下幾方面:
工作量巨大
數據備份和恢復操作貫穿全年365天
備份/恢復的工作量佔整個存儲管理的60%-70%
數據很難有效恢復
由於備份窗口或介質失效等原因,備份作業的成功率只有70%左右
恢復時間太長,從磁帶中恢復單個文件往往要花費幾個小時甚至1天
本質上是一項"體力活"
磁帶庫內磁帶的循環更新,將磁帶拿進取出,不可避免仍需要大量人工干預
進行離場保護時,大量磁帶在數據中心和異地之間的來回運輸,需要耗費大量的人力
 
"一體化數據保護"是解決問題的最佳途徑
好在時至今日,隨着數據量的成倍增長,計算機技術也有了突飛猛進。硬件尤其是硬盤的價格與早期相比有了大幅下降,不斷刷新的硬盤容量也令人驚喜。基於磁盤的存儲新技術(如快照、鏡象等)日益涌現。調查顯示,目前超過80%的恢復請求是在數據丟失後48小時內提出的,這意味着恢復速度更快的基於磁盤的存儲技術開始成爲主流。而由於磁帶在某些方面仍具有不可取代的優勢,如價格低廉、適合數據的長久保留等,因此採用以磁盤和磁帶技術相結合的所謂"一體化數 據保護"方案,成爲很多企業在進行數據保護時的最佳做法。
 
本地鏡象(快速恢復卷):
在某一時間點,對生產數據進行同步,然後斷開,以保留生產數據在該時間點的靜止狀態
用於對保留期內整個數據的快速恢復
一天可做一次或若干次本地快速恢復卷,保留24小時
磁盤消耗量高(100%)
對應用影響較大
 
數據快照:
採用Copy-on-Write的方法保留與前一基準點相比已變化的數據
基準點數據出現問題就無法使用
用於保留期內對少量數據的快速恢復
使用頻率較高, 例如:每2小時快照一次,常保留24-48小時
磁盤消耗量較低(5%-20%)
對應用影響較小
 
異地鏡象:
對生產數據的100%異地鏡像
對由於邏輯錯誤而丟失的數據沒有保護作用
常用於對生產站點的容災保護
採用連續複製以保持與生產數據一致
同步複製方式
異步複製方式
近線存儲:
用於對生產數據進行備份
常採用廉價的ATA/SATA磁盤陣列作爲備份設備,以提高速度和可靠性
通常數據保留時間爲1周-1個月,然後,被遷至磁帶庫作更長時間的保留或歸檔
 
磁帶庫:
磁帶是數據長久保留/歸檔的最佳選擇
磁帶上的數據往往被視爲數據保護的最後防線
由於磁帶可以在物理上與生產系統脫離,磁帶可以用於數據離場保護
磁帶存儲成本仍然是最低的
某世界著名的大型石油公司的"一體化數據保護"做法就很值得借鑑:每天上午8點,對重要的SAP數據做一次"克隆",產生本地鏡象;之後每隔4小時 對數據變化量進行快照,每個快照保留48小時。每天晚上12點,將快照中的數據備份到近線存儲設備,保留兩週。兩週後,將數據拷貝到磁帶庫中保留一年。磁帶庫中的數據同時複製有多個副本,其中一個數據副本作離場保護,妥善保管到異地的倉庫或辦公室。與此同時,這些數據也採用複製的方式產生異地鏡象,以實現 容災保護。
可想而知,在上述"一體化數據保護"措施的周密保全下,該公司面對各種情況下的數據丟失都能從容應對:若需要恢復48小時內丟失的數據,可從本地鏡 象和快照中恢復;若需恢復兩週內遺失的數據,可從近線存儲設備中恢復;而兩週以後的數據則可以從磁帶庫中進行恢復;萬一發生了火災或類似"9.11"之類 的大型災難,也不必驚慌失措,則可以切換到容災點(異地鏡象),也可以從離場保護的磁帶副本中恢復所有數據。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章