章節目錄
故障描述
環境描述:虛擬平臺ESXi6.5,後端採用Mega LSI芯片RAID卡,4塊3TB磁盤組建RAID5
故障現象:ESXi識別到分區,但無法加載,查看爲RAW分區。
故障歷史過程:
該平臺之前採用3塊3TB磁盤組建RAID5,後來擴容了一塊磁盤;變成4塊磁盤RAID5。
1、主板故障,在更換主板時,更換了硬盤位置。此時系統仍可以正常使用;
2、又更換了一次磁盤位置。此時出現掉盤,並且RAID信息也丟失。
3、用跳過初始化的方式新建RAID。此時出現ESXi識別到分區,但無法加載,用普通數據恢復軟件查看爲RAW分區的故障現象。
數據恢復思路
告知用戶,不要對故障環境做任何動作,防止更嚴重的二次數據破壞,並梳理恢復步驟如下:
- 所有磁盤都能認到,不存在硬件故障。磁盤故障會影響數據恢復,但並不致命。
- 因用戶新建過RAID,所以要確認磁盤是否被RAID初始化清零。雖然用戶說跳過了初始化,但這一步仍要確認,磁盤未被清零是繼續RAID恢復的前提。
- RAID的磁盤順序已經混亂,必做分析出正確的磁盤順序,並在數據恢復軟件中模擬重組RAID。RAID盤序正確是繼續VMFS文件系統恢復的前提。
- 如果分區未被破壞,可以直接恢復數據;如果分區被破壞,則需要裸磁盤掃描恢復數據。
- 恢復數據,啓動業務。
數據恢復過程
- 搭建數據恢復環境。把磁盤從RAID卡上撥出,插入到安裝Windows2008的系統主板磁盤接口上,啓動Windows系統。
- 檢查磁盤底層數據受損情況。用WinHex查看了4塊磁盤扇區,發現有數據;並計算了4塊盤的Xor校驗,發現取樣的幾處都是對的,說明底層數據完整。(以下示例圖)
- 還原RAID盤序。RAID盤序有3種辦法獲得:
- 通過還原磁盤移動過程,反推出最初正確的RAID盤序。需要管理員有原始記錄。
- 根據文件系統特性,和扇區分析,得出正確的RAID盤序。過程複雜,需要專業人員分析。
- 用專業恢復軟件的智能分析功能,可自動分析出正確的RAID參數和盤序。專業軟件,使用及授權請諮詢數據修復工作室。
- 本案例的情況比較特殊,客戶重新創建過RAID,導致軟件在分析時受了幹攏,所以本次是人工分析磁盤扇區,結合VMFS結構,得出正確的盤序。專業工程師操作,過程複雜,略去不表。
- 重組RAID。
在RAID恢復嚮導中,配置正確的RAID參數後,退可用軟件自動顯示出分區和目錄結構:
特別注意
VMFS文件系統是封閉的,逆向底層數據結構難度大,而虛擬平臺通常是生產環境,數據丟失情況少,大部分管理員在VMFS數據恢復方面的經驗並不多,嘗試性操作可能帶來不預測的數據二次破壞。
本案例中,難點是RAID重組,因爲用戶新建過RAID,導致RAID重組難度爲“困難級別”。
技術支持
溫馨提示:如重要數據丟失,還請在行動前諮詢專業工程師建議,以免數據遭到二次破壞。
企業級恢復支持:https://item.taobao.com/item.htm?id=584274607493
個人級恢復支持:https://item.taobao.com/item.htm?id=592356374811
官方網站:http://www.data-unit.com/