當存儲EVA出現故障這種方法可高效解決數據丟失的情況

EVA存儲設備信息

1、HP EVA8400存儲1組擴展櫃

2、12個2T FATA磁盤(AG691A 454414-001)和8個300G 15K FC磁盤(AG690A 454411-001)組成

3、主機環境爲WINDOW

 

EVA存儲故障分析

1、經與用戶再三確定得知,數據出現故障後已停止使用按照以往HP-EVA的故障可能推斷,數據恢復的可靠性較高。

2、EVA主機及擴展櫃正常關機,之後將所有硬盤標好位置序號,拿出。在數據成功恢復之前,不再開啓EVA 8400控制器。

3、接手磁盤後,按照相應鏈路對磁盤進行連接。

 

4、進入WINDOWS環境,用WINHEX查看磁盤情況,發現所有磁盤均可正常識別。

5、查看每個磁盤信息,發現300G FC磁盤存在PV HEAD,而1T FATA磁盤上均無PV HEAD。查看300G磁盤中存儲的Metadata,發現僅描述了一個RSS組組成的LUN,大小不足2T,成員爲所有300G磁盤。而1T FATA磁盤中殘留的LUN信息則至少包括5組信息。上述信息表明,某種原因導致刪除了1T 磁盤組成的DISK GROUP內所劃分的所有VDISK,並UNGROUP了所有1T FATA磁盤。

6、分析1T FATA磁盤上保留的Metadata。

EVA存儲故障恢復過程】

1、對所有磁盤做完整鏡像。

2、對300G 磁盤所屬的LUN進行恢復。

3、因1T磁盤已全部UNGROUP,關於RSS的分配,以及本身的磁盤ID均無法得知。故需進行人工方式分析RSS配置表。通過META信息的對照,以及通過xor信息區的校驗驗證,得到如下rss組配置表:

3-0  hd6

3-1  hd8

3-2  hd2

3-3  hd9

3-4  hd10

3-5  hd5

2-0  hd0

2-1  hd7

2-2  hd1

2-3  hd11

2-4  hd3

2-5  hd4

4、重組及整合所有LUN的存儲分配表。

5、根據存儲分配表,及RSS磁盤分配表,對所有LUN進行提取。提取過程中,對不通過的XOR條帶進行人工分析,確定離線情況(本例沒有掉線磁盤),確定得到最佳重組結論,再進行數據恢復工作。

EVA存儲故障數據恢復結論】

經重組後數據可正常訪問,經用戶驗收數據無誤,至此數據恢復工作結束。

發佈了316 篇原創文章 · 獲贊 35 · 訪問量 28萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章