重複數據刪除的詳細信息

IBM的IT服務能力在業界素來享有盛名,並且也很爲用戶所認可。例如,大慶油田勘探開發研究應用軟件研究室主任單延明說,他們之所以選擇IBM XIV作爲雲存儲基礎架構平臺,不僅是XIV經受了他們嚴格的性能測試,還因爲他們非常認可IBM的服務模式。


基於陣列的數據精簡技術,例如,在數據被寫入時,A-SIS在線運行,減少主存儲容量。WAFL(NetApp的任意位置寫入文件佈局技術)的重複數據刪除功能可實現寫入時對4K數據塊複本的識別(創建4K數據塊的32-bit弱數字信號,接着一個字節一個字節地進行對比以保證不出現hash衝突),並將其放進元數據的一個簽名文件。這一複本識別任務與快照技術相似;在控制器資源充足的情況下,是在後臺進行的。其默認每24小時進行一次,每次更改的數據量可達20%。


從性能的角度來看,Scality並沒有Isilon高效,但它提供了一種可能解決該問題的方法。


NetApp採用的方法和Isilon的方法一樣“高性能”,而且是以更加簡單的方式來解決這個問題,它並沒有重複刪除元數據的複製。重複數據刪除在單個節點上實現,而集羣更加智能於聚合同類型的文件。這對性能和重複數據刪除都更加有利。


從本質上講,NetApp 重複數據刪除依賴的是一項成熟的計算機科學技術 — 引用計數。過去,Data ONTAP 僅跟蹤數據塊是閒置還是在使用。現在,藉助重複數據刪除,它還能跟蹤數據塊的使用次數。對於 NAS 和 SAN 配置,藉助重複數據刪除,單個塊最多可引用 255 次。文件不“知道”它們在使用共享塊 — 在 WAFL 中進行記錄能以不可見的方式管理這些詳細信息。
發佈了28 篇原創文章 · 獲贊 0 · 訪問量 1萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章