數據保護方案的演進

前兩天,在KVM虛擬化QQ羣/微信羣做過一個關於“數據保護方案的演進“的分享,反響還不錯,文章發表在盛大遊戲G雲微信公衆號;現整理成下文,方便有需要的朋友閱讀

數據是除人以外一個企業最重要的資產,如何保證關鍵數據不丟失、保證業務連續性,一直是IT部門的重要KPI指標,數據保護自然也備受重視;從傳統的手工操作,到之後基於主機的備份,然後是CDP技術、LAN-free,Server-free和Server-less,再到最近興起的雲備份,各種備份技術和概念也層出不窮、日新月異。今天就藉此機會和大家一起聊聊各種備份技術,通過下文希望大家能瞭解各種備份技術的原理,優缺點。

先來看看什麼是備份,什麼是恢復及其評估指標RPO和RTO

什麼是備份

備份是指爲防止出現誤操作、系統故障、自然災害等導致數據丟失,而將全部或部分數據從生產主機的磁盤/陣列複製到其他的存儲介質的過程。

什麼是恢復

恢復是指生產系統發生故障後,用過去某個時間點的備份數據對生產數據進行修復的過程。

RPO和RTO

災備系統的設計指標主要與災備系統的數據恢復能力相關,最常見的兩個指標是RPO和RTO:

RPO(Recovery Point Object),恢復點目標是指能把數據恢復到過去的哪一個時間點,描述的是企業能容忍的最大數據丟失量。

RTO(Recovery Time Object),恢復時間目標是指生產系統發生故障後“什麼時候”可以恢復數據,描述的是企業能容忍的恢復時間。

弄清楚了相關概念和評估指標後,下面進入今天的主題 - 一起來學習下各種數據保護技術的原理和優缺點。

1. Host

將C盤的數據拷貝到D盤、U盤或者移動硬盤上,這種純手工的備份方式相信大家都使用過,這就是Host備份的早期方式;更高級一點,爲了避免手工誤操作,可以通過定時任務、腳本實現定時備份;所以Host備份就是將生產服務器上的數據拷貝到備份介質中。

點評:操作簡單、備份速度快,但各備份數據相互隔離,不利於共享,管理複雜,不適合現在大型的數據備份要求;RPO較大,RTO隨數據量的增加而線性增長。

2. LAN

爲解決Host備份的管理複雜性,LAN備份應運而生,在這種備份方式下,每個生產服務器上需要安裝一個備份代理,並和備份服務器通過網絡連接,備份服務器控制整個備份和恢復過程,備份時負責將數據通過網絡傳輸到備份介質中,恢復時負責將數據通過網絡傳輸到生產卷中。典型的組網方式如下:

最初的LAN備份僅支持文件系統、數據庫等的定時備份/快照(RPO通常是幾小時到幾分鐘),並沒有解決RPO太大這一問題;之後一種被稱爲CDP的持續數據保護技術應運而生,該方案通過在文件系統層或者塊設備層安裝過濾驅動,實時捕獲io,能夠實現秒級快照,極大的縮小了RPO;

CDP技術是一種數據備份技術,所以它並沒有減少RTO;爲了提供更好的RTO,另一種瞬間恢復技術也就產生了,該方案通過iSCSI虛擬磁盤技術將備份介質中的數據直接掛載到生產服務器,供業務使用,能夠實現秒級的RTO。

點評: 通過CDP持續數據備份技術和iSCSI掛載恢復技術,LAN備份不僅解決了Host備份中的共享及管理複雜問題,在RPO和RTO兩項指標上也有良好表現。然而,LAN備份需要佔用較多的網絡資源及系統資源,對系統有較大的性能影響。

3. LAN-free

針對LAN備份存在的問題,衍生出了第三種備份模式:LAN-free備份,既然LAN備份需要佔用太多的前端網絡資源,那備份流量就不走前端網絡好了,把備份介質接入後端的存儲網絡,通過存儲網絡完成數據備份,這就是LAN-free的由來。在該模式下,生產服務器上需要安裝備份客戶端(包含備份代理和備份介質管理模塊),並和備份服務器通過網絡連接,還是由備份服務器控制整個備份和恢復過程。備份時,備份服務器發送控制命令後,生產服務器上的備份客戶端會自動將生產數據通過網絡傳輸到備份介質中。典型的組網方式如下:

點評: LAN-free備份解決了LAN備份佔用大量前端網絡資源的問題,但是其對生產系統的和備份服務器的壓力還是比較大。

4. Server-free

那有沒有一種不佔用生產系統資源就能完成數據備份的方案? 當然是有的,那就是Server-free。該方案通常與存儲快照一起使用。備份時,由備份服務器通知存儲創建快照,然後備份服務器掛載該快照卷,接着將快照數據拷貝到備份介質。由於快照時間非常短,所以對生產系統基本沒有影響,所以稱爲Server-free,典型的組網方式如下:

點評: Server-free備份方式解放了生產服務器,可是備份服務器還生活在水深火熱中;那有沒有一種更徹底的解決辦法呢?

5. Server-less

Server-less備份方式下,應用數據直接在源介質和備份介質之間傳輸。備份時,備份服務器只需要給生產服務器下發控制命令,源介質就會將數據通過網絡傳輸到備份介質,不再需要備份服務器的介入,即可完成整個備份過程。典型的組網方式如下:

Server-less是怎麼實現的呢? 主要有下面兩種方式:

SCSI-3

藉助SCSI-3命令,Extent Copy實現自動將數據備份到帶庫中;但是這種方式兼容性比較差,只能實現卷或者磁盤一級的備份,粒度較大,實際中使用很少。

NDMP

NDMP(網絡數據管理協議)備份主要用在NAS設備上,是Server-less備份方案中常用的技術;NAS設備接收到NDMP送達的備份命令後,會自動將數據傳輸到備份介質。

點評: Server-less備份方案是佔用資源最少、最經濟的一種備份方式,基於NDMP技術的NAS備份是業界比較流行的一種備份實現方式,然而基於SCSI-3命令的SAN備份由於兼容性差,使用較少。

6. 雲備份

到這裏,傳統的5種備份方案就介紹完了。下面簡單聊聊最近2年國內新起的雲備份,實際上2008年國外就出現了雲災備的概念,然而由於種種原因並沒有普及;2013年左右雲災備開始引入國內,之後隨着雲計算的普及以及雲存儲價格的降低,2014開始一波有前瞻性的創業者和傳統災備企業開始涉足雲災備市場,雲災備開始以獨立的業務形態出現。

繼續之前,先來看看雲備份的概念,雲備份是指將位於客戶主機上的數據通過網絡傳輸備份到雲端(存儲服務提供商部署的異地數據中心),爲恢復數據提供副本。

由雲備份的概念,我們可以知道雲備份是傳統備份方式的延伸,它把傳統備份方案中的備份服務器(備份介質)部署(延伸)到了雲端,而客戶端的備份技術依然有效,所以雲備份的部署架構與傳統備份方案的架構很很多相似之處,下面是一個例子(摘自Amazon雲災備官網):

更多雲災備的信息,可以參考Amazon雲災備官網, 以及閱讀白皮書《使用AWS雲服務建立災難備份系統》

今天的分享就到這裏,謝謝大家。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章