災備演練

12月20日:

災備演練前告知災難管理小組及相關業務部門提前做好準備工作。


12月21日:

一、【容災演習-第一階段開始】

1、7點鐘災難發生(模擬南匯生產機房火災,導致服務器、網絡設備受損嚴重、各業務均不可訪問)。

2、7時32分完成災難確認及災難評估,同步上報災難管理小組決策是否進行災備切換。

3、7時50分災難管理小組組長決策進行災備切換,按既定流程,確定於8:00準時開始切換核心營運系統到無錫災備中心,預計10:00恢復核心系統及周邊系統。

4、7時50分內部門戶發佈災備演練維護通知,計劃於 2014-12-21 10:00 切換完成,涉及業務操作詳情請各業務部門諮詢各事業部解決方案推廣小組。

5、8時xx官網發佈《xx系統升級告客戶書》,並實時記錄業務量情況,每半小時展現一次數據。

6、8時災備切換執行團隊進行切換,災備切換進度實時通過進度工具展現。切換工作按照預期計劃正常進行,整體進展順利。

7、截止9時00分核心營運系統等10個系統已切換至災備中心,同步進行災備中心內網功能驗證工作。預計10點災備中心開始對外提供服務。

8、截止9時30分核心營運系統及周邊相關係統等10個系統切換至災備中心後,災備中心內網功能驗證工作已完成,所有系統驗證正常,9時30分災備中心開始正式對外提供服務,其它切換工作按照預期計劃正常進行,整體進展順利。同步進行業務回訪,涉及異常由各事業部解決方案推廣組進行對接解決。實時查看業務開單量及災備系統、網絡運行狀況。

9、9時30分內部門戶更新災備演練維護通知,計劃於 2014-12-21 12:00 關閉使用並進行回切操作。


二、【容災演習-災難回切評估】

1、回切軟硬件條件具備 ;數據反向同步和校驗完成;回切方案就緒;

2、回切成本評估:①業務中斷時間:12時00分~14時00分爲業務操作低峯期,期間業務可採用線下執行,系統恢復後補錄; ②數據丟失量:0數據丟失;

3、評估結論:生產機房具備回切條件,回切時間處於業務低峯,建議12:00開始回切操作。災難管理小組組長決策進行容災切換回切操作。


三、【容災演習-第二階段】

1、12時整內部門戶更新災備演練維護通知,計劃於 2014-12-21 14:00 回切完成恢復正常使用。

2、截止12時30分核心營運系統及周邊相關係統等10個系統已回切至生產南匯中心,同步進行生產中心內網功能驗證工作。預計12時50分生產中心開始對外提供服務。

3、截止12時50分回切至生產中心後,生產中心內網功能驗證工作已完成,所有系統驗證正常;12時50分上海生產中心開始正式對外提供服務,其它切換工作按照預期計劃正常進行,整體進展順利。


四、【容災演習-演習結束】

總結過程經驗及流程改進。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章