Veeam Replication Failover and Failback總結

使用Veeam Backup  & Replication中的Replication複製功能,將虛擬機從源端複製到目標端,如何很好的利用好複製後的備份呢?在生產系統出現問題時,可以進行failover故障切換,切換過後有一個確認的過程,如果切換後運行正常,可以執行永久切換,如果測試不正常,可以回檔

Failover爲故障轉移、故障切換的意思,即將源端的虛擬機上的負載切換至DR災難恢復站點的複製虛擬機上

Failback爲故障恢復,即將災備站點的複製虛擬機上的負載切換回源端虛擬機上

各個概念的一些差異和區別:

 Replica Failover:將負載從生產端切換至複製端虛擬機,是一種臨時的中間狀態,只能恢復到目標虛擬機的某一個還原點,還原點後改變的數據無法同步至複製虛擬機,與源端虛擬機不完全一致。

 Permannet Failover:永久故障轉移,即對Replica Failover的狀態進一步確認和提交,確定將源端虛擬機負載轉移至複製端虛擬機上,複製虛擬機的狀態同Replica Failover。

 Failover Plan:對於多個有依賴關係的源端虛擬機,確定好各個虛擬機的切換順序和間隔時長,依次進行故障轉移。

 Planned Failover:對計劃停機、計劃的硬件維護等,事先安排好的,將生產端的虛擬機負載切換至目標端複製虛擬機,複製虛擬機和源端虛擬機數據是一致的。

 Undo Failover:生產端虛擬機故障轉移至目標端後,可以執行永久切換(Permannet Failover),也可以對故障轉移進行撤銷,即回退到最初的狀態,工作負載切換回生產端。

 Replica Failback:將複製端虛擬機負載切換回生產端,是複製端虛擬機全部傳遞到生產端,是一種中間臨時狀態,需要進一步操作。

 Commit Failback:對Replica Failback負載從複製端虛擬機切換回生產端虛擬機進行提交確認

 Undo Failback:對Replica Failback負載從複製端虛擬機切換回生產端虛擬機進行撤銷,撤銷後工作負載依然回到災備站點的複製虛擬機。


1. Replica Failover

Replica Failover在目標端基於某一個還原點恢復虛擬機的完整功能,可以快速的啓動起來,執行failover操作時,源虛擬機依然可以正常運轉,完成必要的測試工作後,我們還可以撤銷failover,回到原始的狀態。如果源虛擬機和目標虛擬機處於同一網絡,源虛擬機和目標虛擬機要同時運行時,可以暫時斷開源虛擬機的網絡,以免IP衝突。

推薦使用failover操作,避免手工開啓replica虛擬機電源,避免丟失重要數據。

failover操作的方式:

(1) VBR從必要的複製鏈中的快照進行還原

(2) VBR啓動replica虛擬機,replica虛擬機狀態由normal變爲failover,如果只是測試使用,源虛擬機還在正常運轉。只有當replica VM的狀態由failover轉變爲normal時,replication activies纔可以正常進行。

(3) 所有對複製虛擬機的改變都寫入到了一個變化文件的快照中

clip_image002

failover是一種中間狀態,需要進一步作操作,可以執行undo failover,failback,permanent failover.災難恢復場景中,在測試完成後,應該執行下一步的操作。

2.Permanent Failover

執行permanent failover後,將永久的將源虛擬機切換至複製虛擬機,複製虛擬機將替換掉源虛擬機。適用於源虛擬機和複製虛擬機位於相同的站點,擁有相近的資源,這樣切換後用戶正在進行的操作感覺不到延遲。

permanent failover處理方式:

(1) VBR移除複製虛擬機的還原點,並刪除datastore中的相關文件,所有寫入的數據都提交到變化文件的快照中。

(2) VBR從Veeam Replicaiton console中移除從replicas列表中VM replica

(3) 爲了保護複製虛擬機在執行Permanent failover後不被破壞,VBR重新配置複製任務,將源虛擬機添加到複製的排除列表,下次複製任務執行時將不會複製源虛擬機。

clip_image004

clip_image006

3. Failover Plan

當正在運行的虛擬機存在着相互依賴關係時,可以使用failover plan,來確定各個虛擬機的恢復的先後順序,並設置好啓動的虛擬機之間的延遲間隔時間,默認爲60秒,除了最後一個虛擬機外。一次最多隻能恢復10個,如果超過10個,則會進行排隊,即第一個恢復完成後,纔會啓動第11個虛擬機的恢復。與failover類似,Failover Plan也是一種中間狀態。

clip_image008

clip_image009

啓動Failover Plan

在Failover Plans列表中,選中一個任務,右鍵,點擊start可以恢復到最新的還原點,如果想恢復到指定的還原點,可以使用start to選項

clip_image011

4.Planned Failover

如果主站點計劃停機,則可以以最小的中斷切換工作負載從主虛擬機到複製虛擬機,比如對數據中心進行遷移、維護、軟件進行時,可以執行Planned Failover.

Planned Failover處理過程:

(1) failover進程觸發replication job執行增量複製,將未複製的數據同步到複製端

(2) 源虛擬機關機

(3) failover進程觸發replication job執行另外一次增量複製,同步最後一分鐘產生的增量變化部分。

(4) 虛擬機切換至複製端。

(5) 複製端開機啓動。

clip_image012

注意:這個過程是設計用來將當前工作負載傳遞到目標端的,不建議選擇一個還原點來進行切換。

在Planned failover過程中,VBR創建了兩個輔助還原點,我們可以利用它來做回滾等操作。

主站點主機在線後,我們還可以切換回去,操作類似unplanned failover,包括:undoing failover, permanent failover or failback.

clip_image014

5.Undo Failover

可以使用undo failover將複製虛擬機恢復到failover前的狀態。VBR將複製虛擬機關機,並恢復到快照鏈中最近的快照。寫入變化快照文件中的數據被清理,虛擬機恢復到normal狀態,源虛擬機中複製活動可以繼續進行。

clip_image015

clip_image017

6. Replica Failback

在前期進行了Failover操作,將虛擬機的負載從生產環境切換到了目標端,運行了一段時間,如果想把負載從DR容災端切換回生產環境,可以使用Replica Failback,此操作會將目標端的完整數據完全同步到生產端,可以有如下三種方式:

l Failback回源主機的源虛擬機

l Failback回前期通過備份還原到的一個新位置的虛擬機

l 傳遞完整的文件,Failback一個完整的全新的位置的虛擬機

前兩種方式只需要傳遞增量部分,第三種方式傳遞完整的虛擬機

Failback工作方式

(1) 如果源主機處於開機狀態,VBR將源主機關閉

(2) VBR對源主機創建一個failback快照

(3) VBR計算源虛擬機和複製虛擬機切換狀態時的差異部分

(4) VBR傳遞差異部分到源主機的delta文件的快照中

(5) VBR關閉複製虛擬機直至提交failback或者撤銷failback

(6) VBR對複製虛擬機創建一個failback保護快照

(7) VBR再次計算在最後執行failback過程中的源虛擬機和複製虛擬機的差異部分,再次執行同步操作

(8) VBR移除源虛擬機上的failback快照,將Delta變化文件提交到源虛擬機

(9) 複製虛擬機的狀態從failover切換爲failback。VBR將源主機上的複製活動掛起,因爲這時切換隻是一種中間狀態,還需要後續對這個failback狀態進行提交或撤銷回failover狀態。

(10) 如果選擇了源主機開機選項,VBR將會對源主機進行開機操作。

clip_image019

Failback on VSAN:由於VSAN數據存儲組織特性,VBR無法獲取到位於VSAN中的VM replica與源虛擬機磁盤的差異部分,所以在兩次的計算差異部分均需要讀取複製虛擬機所有的磁盤數據,然後只傳遞差異的部分。

Quick rollback選項

(1) VBR不會從複製虛擬機查詢整個磁盤文件,而是隻查詢CBT獲取差異部分

(2) 使用場景爲複製虛擬機操作系統層面的錯誤,如在複製虛擬機上應用程序錯誤或者誤刪了文件。如果在複製虛擬機上發生了硬件、電源或存儲故障,不要使用Quick rollback選項

(3) 必須是failback到源位置,源虛擬機開啓CBT,複製虛擬機創建時使用了“Use changed block tracking data ”選項。

clip_image021

7. Commit Failback

確認Failback操作,完成恢復到源虛擬機,需要對Failback進行提交Commit

(1) VBR將複製虛擬機狀態由Failback更改爲Normal

(2) 如果是還原到一個新的位置,VBR重新配置複製任務,將之前的源虛擬機添加到排除列表,新的還原的虛擬機取代了原來複制任務中的源虛擬機,新複製任務開始時,VBR將會處理新的被還原的虛擬機,而不是原來的源虛擬機。如果是還原到原位置,則VBR按正常模式處理。

clip_image022

clip_image024

8. Undo Failback

當負載從複製虛擬機遷移到生產環境,而沒有提交Commit時,發現生產環境的虛擬機工作不正常,可以Undo Failback撤銷.

(1) VBR刪除VBR保護快照

(2) VBR將複製虛擬機狀態由Failback改爲Failover

clip_image026clip_image027

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章