XX證券-12TB HDS FCSAN Ext4 視頻文件恢復案例(基於特定視頻解碼+人工智能分析)

目錄

環境信息

故障原因

恢復過程

特別注意

技術支持


環境信息

某證券營業部,後端12TB HDS存儲LUN,掛載給RH9,並創建EXT4文件系統,存儲證券用戶的開戶視頻認證mp4文件,單個視頻文件從500KB-50MB。故障前存儲數據量約2TB。


故障原因

在數據存儲目錄,誤執行了rm * -rf命令,發現誤操作後立即中止,仍然刪除了約70GB數據,之後又寫入了約20GB新的視頻文件。

本次需要恢復2018-2019的6000個櫃檯營業員+用戶的合成視頻,數據量約6GB。


恢復過程

客戶在聯繫數聯體前,已經找另一家數據恢復公司嘗試過掃描恢復,但其掃描恢復出的1000多個無名視頻文件,均不是客戶需要恢復的視頻,恢復失敗。

接到本案後,與客戶充分溝通了環境信息,和故障前後的操作,判斷已經不能用常規方案掃描LUN,因爲掃描一次需要2-4天,沒有必要再嘗試一次。

  • 分析12TB LUN的數據組成:

大量視頻文件,均爲MP4,但格式各異,有前期未處理的原始視頻,有處理過程中的視頻,有拼接後的視頻

小部分其它文件

  • 分析目標MP4特性。因爲證券公司的MP4視頻是內部軟件合成,與常規視頻文件有差別。此處爲重點:

打開一個客戶定製的MP4文件,解析出其頭部固定特性:

解析出其特殊尾部特徵:

以上信息將索引出12TB LUN中所有視頻文件,總數據量達2TB,如此海量目標是無意義的。我們必須縮小範圍,客戶要恢復目標視頻有固定分辨率是640x240。本案例的視頻信息採用Big Endian編碼,在avc1字段,分別存儲了視頻寬度和高度,下圖中0x0280和0x00F0,即表示爲640x240:

按以上規則定製搜索規則,即可搜索出640x240分辨率的所有視頻,且均爲目標視頻,大約2萬個,以下爲部分測試數據展示:

但以上辦法恢復出的2萬個視頻,仍沒有文件名,客戶無法直接用於業務系統。

好在客戶的數據庫運行正常,用戶開戶的身份證高清照均有保存,因此我們再採用python的OpenCV視頻流+圖片識別,將視頻中的客戶區域與所有客戶的照片庫做對比,成功將視頻文件的約90%還原爲正確的文件名。以下爲部分代碼展示:

因圖片與視頻差另過大,導致剩下約10%無法識別的視頻 ,採用人工聽視頻客戶的自我介紹,也在1個工作日後全部匹配成功。

本次恢復完成。


特別注意

核心數據恢復,需要深刻理解客戶環境,充分調動一切資源,並定製開發專用程序,才能最大程度挽回損失。


技術支持

恢復支持:https://item.taobao.com/item.htm?id=577090061943

官方網站:http://www.data-unit.com/

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章