內容尋址存儲CAS技術淺析

 EMC Centera的RAIN體系結構
  Centera系統的體系結構主要由四個部分組成:所要存儲的數據對象、應用軟件服務器、Centera存儲服務器和客戶端數據庫。整個數據的存儲可以分爲五個過程:
  (1)由應用軟件服務器創建或使用數據對象;
  (2)應用軟件服務器在IP通路上通過一套Centera的標準API把數據對象發送給Centera存儲服務器;
  (3)Centera存儲服務器按照特定算法針對所存儲的數據內容片斷的本身生成全局惟一的內容地址;
  (4)Centera存儲服務器把這一內容地址返回給應用軟件服務器;
  (5)內容地址由應用軟件服務器保存在專用數據庫中,以備客戶端用戶存取。
  Centera的CAS網絡存儲服務器採用了一套獨特的可以避免任何單點故障(No-Single-Points-of-Failure)的RAIN(Redundant Array of Independent Nodes,獨立節點的冗餘陣列)存儲體系結構,與CentraStar操作環境一起實現了一套集TB-PB安全高效擴展、自管理、自修復和自動重配置與一體的內容尋址存儲系統。整個系統由很多節點構成,所有節點分爲存儲節點(Storage Nodes)和訪問節點(Access Nodes),其中前者主要用於存儲和保護數據,而後者主要爲外部提供API訪問。RAIN系統包含構成如下圖所示。RAIN中的每一個節點都包含一套高端配置的計算機系統(典型配置:2GHz P4 CPU/512MB RAM/320GB EIDE/10/100BT NIC)和運行在Centera之上的操作環境CentraStar——在整個Centera中處於核心和關鍵地位。
  Centera的軟硬件在一個機櫃內實現了一套P2P透明的集羣環境,而這個機櫃對於CAS網絡存儲客戶端用戶而言不過是一個“黑箱”罷了。Centera的初始配置容量爲2.9TB,並且還可以非常便捷地擴充至幾百TB甚至PB。一個機櫃就能裝有8、16、24或32個完全一樣的節點,可以分別提供3.8TB、7.7TB、11.5TB或15.4TB的映像存儲容量。Centera的每一個節點都具備數據處理能力,都擁有1TB的原始數據存儲能力,並具有通過一個私有LAN與CAS網絡存儲系統的其他集羣節點進行互連。
  當需要向CAS網絡存儲系統增加存儲容量時,新容量就作爲“構建塊”加入Centera的自配置系統,運行在Centera上的駐留軟件就會通知整個網絡存儲系統有新的容量添加進來,並立刻爲系統可用。
  Centera大大簡化了網絡存儲系統的規劃和管理,用戶不必關心RAID類型,也不必擔心LUN綁定,更不用考慮創建何種文件系統。應用程序和存儲管理員可以從繁重的超大容量文件系統管理和極爲複雜的多網絡存儲拓撲結構中解脫出來。
  據估計,在採用Centera的CAS網絡存儲系統中,一個管理員能夠管理幾百TB甚至PB級的數據,而在傳統網絡存儲解決方案中僅能有效管理20TB~50TB的數據量。
  概括地講,基於RAIN結構的CAS網絡存儲系統的特點主要包括以下幾點:
  透明的P2P集羣存儲環境;
  自配置功能;
  各個節點均冗餘;
  通過鏡像和奇偶保護手段來加強內容保護;
  通過CDF+Blob來加強自診斷和自恢復能力;
  遠程監控能力;
  不可能發生任何單點故障。
  EMC Centera存儲系統的應用
  通過以上分析可以看出,面向固定內容存儲的Centera網絡存儲系統較傳統網絡存儲技術能夠更好地適應信息急劇增長的實際需求,具有廣闊的發展前景,可以廣泛地應用到企業級內容/文檔管理、HSM解決方案、PC備份和歸檔、E-mail服務、醫療成像等諸多領域,典型的Centera固定內容尋址存儲的體系結構如下圖所示。
  下面以Centera爲例,簡要地介紹一下CAS的具體應用。
  (1) 企業級內容/文檔管理
  Centera在這類商業應用中使存儲內容的可靠性和信息保存符合一般的企業級存儲需求,並可以與應用程序簡單地集成在一起,提高了可訪問性;它高效率地利用存儲設備;自配置、自管理和自恢復帶來了低管理開銷;存儲內容與位置無關並使商業服務具有連續性。
  典型的Centera商業應用如下圖所示。
  (2)E-mail服務
  Centera對電子郵件業務主要有以下功能:對郵件的透明化歸檔處理,無需用戶插手;高效存儲消除了大量郵件副本的存在,正好適合這類應用的需求;存儲內容的可靠和保存;提高了可訪問性;高效率的存儲利用;自配置、自管理和自恢復所帶來的低管理開銷;大規模可擴展性。
  Centera的電子郵件服務如下圖所示。
  (3)醫療成像
  Centera對醫療成像系統的影響主要包括以下幾個方面:存儲內容的可靠性和保存符合一般的企業級存儲需求;非常容易地訪問大量歸檔信息;大規模可擴展性;自配置、自管理和自恢復所帶來的低管理開銷;保證技術的長久適應性。
  CAS標準化進程
  正是由於CAS技術在歸檔及固定內容存儲和恢復參考信息領域所具有的獨特優勢,才使業內越來越認識到了爲這個新興技術建立業內標準的緊迫性和重要性。如今,SNIA正在聯合CAS領域內的兩個領軍人物EMC和Permabit 共同制定關於固定內容尋址存儲解決方案的相關標準,即Content Addressable Storage Solutions Initiative(CASSI)。今後,CASSI還將作爲SNIA的數據管理論壇和信息生命週期管理計劃的一部分。
  CASSI將始終關注CAS技術的發展,爲最終用戶和相關廠商提供各種相關的及時有效的信息資源和工業標準解決方案。除此之外,CASSI中最主要的工作目標就是爲CAS技術設定基於存儲管理界面的統一的管理界面。(注:存儲管理界面SMI是SNIA開發的一種標準管理接口,旨在減輕多廠商SAN環境的管理負擔。SMI-S爲各種網絡組件提供了一個通用管理接口,減小了SAN管理的複雜性。)
  世界著名的評估公司Evaluator Group的資深分析家Randy Kerns指出,在存儲領域裏有好幾個有關數據記錄與保存的認證機構,而到目前幾乎還沒有任何基於磁盤記錄的CAS產品擁有這些認證。
  既然這樣,那麼未來的CAS網絡存儲之路是繼續走“市場應用完全決定標準制定”呢,還是“在標準化旗幟下大家一起奮勇前進”呢?在筆者看來,有關服務商在努力改進並極力推廣其解決方案的同時,能夠積極地關注全球網絡存儲標準化的進程應該是非常明智的舉措,畢竟蛋糕雖大,一人難吃。
  CAS網絡存儲技術的前景究竟如何,我們還是拭目以待吧!
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章