企業災難恢復流程規範
(原創)
第一章 概述
1 前言
隨着信息化的發展,很多企業或者單位缺乏災難恢復的規範流程,因此自己半路出家,憑着自己多年的經驗,撰寫這篇文章,本文充分借鑑了國際和國內的信息安全標準來編寫,具有很強的實踐意義,可以幫助企業建立全面的災難恢復流程規範,防止業務系統宕機或者中斷,而影響企業業務的正常運行。
2 參考相關信息安全文獻
本文我充分借鑑了國際與國內標準,標準如下:
l ISO /IEC 27000家族中的ISO /IEC 27002
l BS25999 業務持續性管理標準
l ITIL (ISO 20000標準)
l 信息安全等級保護標準規範
GB/T 20984-2007信息安全技術信息安全風險評估規範
GB/Z 24364-2009 信息安全技術信息安全風險管理指南
GB/T 20988-2007 信息安全技術信息系統災難恢復規範
3 適合人員
本流程適用的人員包括:IT經理、主管或領導、系統管理員、系統工程師、安全工程師和信息安全人員等。
4 版權所有
本文章僅提供網上共享學習之用,未經書面授權,不得用於任何商業途徑。
5 關於本人
轉眼時間,工作四年多了,對那些工作很多年的人來說,也許我的資歷不足,沒資格寫這篇文章。在這四年的時間內,自己一直追逐着IT,有做過設備售後、運維工作等,其中有喜有悲、百感交集,其中的辛酸也許只有自己知道。目前一直從事信息安全的工作,雖然現在離開了測評機構,但是我仍然一直致力研究等保的標準規範、測評方法和安全建設整改,爲那些剛入門的人提供力所能及的事情。
第二章 災難恢復的內容
6 災難恢復內容簡述
業務系統的災難恢復工作,它包括兩個方面,第一:災難恢復規劃;第二:災難備份中心的日常運行、關鍵業務功能在災難備份中心的恢復和持續運行,以及主系統的災後重建和回退工作,還涉及突發事件發生後的應急響應的工作。同時,業務系統的災難恢復規劃是一個周而復始、持續改進的過程,它包含如下幾個階段:
1) 業務系統災難恢復的需求確定;
2) 業務系統災難恢復策略的制定;
3) 業務系統災難恢復策略的實現;
4) 業務系統災難恢復預案的制定、落實和管理。
7 設立災難恢復組織機構
爲了保證企業的業務系統在災難恢復的情況下有序地進行,因此必須要成立災難恢復的組織機構或者災難領導小組,在這些組織或者領導小組中,一般都是由企業的管理者、業務、技術和行政後勤等人員組成。一般可設爲災難恢復領導小組、災難恢復規劃實施組和災難恢復日常運行組。一般可設爲災難恢復領導小組、災難恢復規劃實施組合災難恢復日常運行組。
在單位內部技術力量不夠或者信息系統複雜的情況下,可以聘請具有相應資質的外部專家協助災難恢復實施工作,也可委託具有相應資質的外部機構承擔實施組以及日常運行組的部分或全部工作。
8 組織機構的職責
8.1 災難恢復領導小組
災難恢復領導小組是信息系統災難恢復工作的組織領導機構,組長應由組織最高管理層成員擔任。領導小組的職責是領導和決策信息系統災難恢復的重大事宜,主要如下:
1)審覈並批准經費預算;
2)審覈並批准災難恢復策略;
3)審覈並批准災難恢復預案;
4)批准災難恢復預案的執行。
8.2 災難恢復規劃實施組
災難恢復規劃實施組的主要職責是負責:
1)災難恢復的需求分析;
2)提出災難恢復策略和等級;
3)災難恢復策略的實現;
4)制定災難恢復預案;
5)組織災難恢復預案的測試和演練。
8.3 災難恢復日常運行組
災難恢復日常運行組的主要職責是負責:
1)協助災難恢復系統實施;
2)災難備份中心日常管理;
3)災難備份系統的運行和維護;
4)災難恢復的專業技術支持;
5)參與和協助災難恢復預案的教育、培訓和演練;
6)維護和管理災難恢復預案;
7)突發事件發生時的損失控制和損害評估;
8)災難發生後信息系統和業務功能的恢復;
9)災難發生後的外部協助作。
9 災難恢復流程的管理
機構組織應評估災難恢復規劃過程的風險、籌備所需資源、確定詳細任務及時間表、監督和管理規劃活動、跟蹤和報告任務進展以及進行問題管理和變更管理。
10 災難恢復與外部聯繫
機構組織應與相關管理部門、設備及服務提供商、電信、電力和新聞媒體等保持聯絡和協作,以確保在災難發生時及時通報準確情況和獲得適當支持。
11 災難恢復的安全審計
災難恢復的預案制定了之後,需要對相關的恢復預案做整個信息安全的審計,以便在這個恢復過程中安全可靠地運行。
12 災難恢復需求的確定
在一個信息系統環境中,需要確定哪些重要數據是需要備份,且要安全防護起來。同時這些數據在災難恢復的過程中,會引起意想不到的後果,因此要引進風險分析的過程,要識別信息系統面臨的自然和認爲的威脅,識別信息系統的脆弱性,分析各種威脅發生的可能性並定量或定性描述可能造成的損失,識別現有的風險防範和控制措施。通過相關的技術和管理,使得數據在災難恢復的過程中順利進行。
13 災難恢復中的數據業務影響分析
在對組織中的業務數據進行災難恢復的時候,首先需要對這些數據進行各項業務功能之間進行分析,評估這些數據在災難恢復的過程中,出現相關的風險,如數據恢復不過來或者有相關數據的丟失,在這麼一個高風險的情況下,評估是否對組織的業務影響是否大。因此需要進行評估中斷方面的分析:
13.1 定量分析
定量分析就是以量化的方法去評估業務數據功能的中斷可能給組織帶來的直接經濟損失和間接經濟損失。
13.2 定性分析
定性分析是運用歸納與演繹、分析與綜合以及抽象與概括等方法,評估業務功能的中斷可能給組織帶來的非經濟損失,包括組織的聲譽、客戶的忠誠度、員工的信心、社會和政治影響等。
第三章 災難恢復數據的最終確定
13.3 數據最終確定
經過以上的風險分析,我們最終確定了需要對那些數據進行備份,如:數據庫(MS SQL 、Mysql、DB2等等)、操作系統、業務應用程序、中間件、VMWARE等等數據和相關程序。在這些數據當中、相關組織機構的管理該內容的管理人員,需要安排相關的負責人來執行這些災難恢復,同時負責人要熟悉這些業務或者程序的使用。在這些數據恢復的過程中,一定要確保支持災難恢復數據的相關備份系統,如:硬件的備份設備、軟件備份介質和相關備用基礎設施等要到位。同時,相關的災難恢復小組人員、規劃實施小組人員和日常維護的管理人員等都要同時到位,確保災難的恢復正常運轉。
13.4 成本效益分析原則
組織機構的不同、相關的配套設施會有所不一樣,但是在這種情況下,應該分析成本與收益的不同,根據災難恢復的目標,按照災難恢復資源的成本與風險可能造成的損失之間取得平衡的原則,對待不同的關鍵業務,會使用不同的災難恢復策略,確保整個業務數據恢復得正常,同時,使用備份基礎設施成本地的情況下,也能夠使得相關的數據正常運作,保證組織機構的業務正常運行。