【轉】分佈式存儲與傳統存儲架構

考點:分佈式存儲架構

百度百科:https://baike.baidu.com/item/%E5%88%86%E5%B8%83%E5%BC%8F%E5%AD%98%E5%82%A8%E6%9E%B6%E6%9E%84/21516933?fr=aladdin

 

隨着主機、磁盤、網絡等技術的發展,對於承載大量數據存儲的服務器來說,服務器內置存儲空間,或者說內置磁盤往往不足以滿足存儲需要或者雖然能滿足要求,但各個服務器之間獨立,嚴重降低了磁盤的利用率。因此,在內置存儲之外,服務器需要採用外置存儲的方式擴展存儲空間,今天IT君給大家分享一下當前主流的存儲架構。

直連式存儲(簡稱DAS)

DAS存儲是最爲常見的存儲形式之一,特別是其是在規模比較小的企業中。由於企業本身數據量不大,且光纖交換機等設備價格昂貴,因此基本都採用高密度的存儲服務器或者服務器後接JBOD等形式,這種形式的存儲屬於DAS架構。

 

 

對於DAS存儲,其實可以是在服務器內部直接連接磁盤組,或者通過外接線連接磁盤陣列兩種方式。對於外聯的方式通常是通過SAS線進行連接,其實通過FC進行服務器與磁盤陣列的連接也可以理解爲DAS存儲形式,並沒有嚴格的定義。對於通過SAS方式直連的DAS通常需要通過硬件RAID卡或者軟RAID的方式實現磁盤的冗餘保護,防止由於磁盤故障導致整個存儲系統的不可用而丟失數據。同時,採用該種方式的存儲通常還需要在主機端安裝備份軟件對數據進行定期備份,以防止設備故障導致數據丟失。

無論直連式存儲還是服務器主機的擴展,從一臺服務器擴展爲多臺服務器組成的羣集(Cluster),或存儲陣列容量的擴展,都會造成業務系統的停機,從而給企業帶來經濟損失,對於銀行、電信、傳媒等行業7×24小時服務的關鍵業務系統,這是不可接受的。並且直連式存儲或服務器主機的升級擴展,只能由原設備廠商提供,往往受原設備廠商限制。

 

網絡連接存儲(簡稱NAS)

網絡儲存設備 (Network Attached Storage,NAS),從名稱上可以看出是其可以通過以太網方式接入並進行訪問的存儲形式。簡單來說NAS就是一臺在網絡上提供文檔共享服務的的網絡存儲服務器。NAS存儲設備可以直接連接在以太網中,之後在該網絡域內的不同類型操作系統主機都可以實現對該設備的訪問。使用者可以通過某種方式(例如linux下的mount命令)將存儲服務掛載到本地進行訪問,在本地呈現的就是一個文件目錄樹。我們所熟悉的NFS其實就是一個NAS存儲形式,NFS服務器就是NAS存儲設備,我們可以通過開源軟件搭建該種類型的存儲設備,當然市面上也有很多成熟的產品。

NAS與傳統的直接儲存設備不同的地方在於NAS設備通常只提供了資料儲存、資料存取、以及相關的管理功能,不會與其它業務混合部署,這樣就增加該設備的穩定性,減少故障的發生概率。NAS的型式很多樣化,可以是一個大量生產的嵌入式設備,也可以在一般的電腦上執行NAS的軟件。NAS用的是以文檔爲單位的通信協議,這些通信協議都是標準協議,目前比較知名的是NFS和CIFS兩種。其中NFS在UNIX系統上很常見,而CIFS則在Windows系統經常使用。

目前也有一些開源的軟件實現了NAS的功能,例如FreeNAS和Openfiler 等開源軟件。其中FreeNAS的開放源碼NAS軟件用的就是精簡版的FreeBSD操作系統,它可以在一般的電腦硬件上執行,而商業化的嵌入式設備用的則是封閉源碼的操作系統和通訊協定程式。而Openfiler則能把標準x86/64架構的系統變成一個強大的NAS、SAN存儲和IP存儲網關,爲管理員提供一個強大的管理平臺,並能能應付未來的存儲需求。

NAS產品有一個比較大的優勢是真正即插即用。NAS設備一般支持多計算機平臺,用戶通過網絡支持協議可進入相同的文檔,因而NAS設備無需改造即可用於混合Unix/Windows NT局域網內,同時NAS的應用非常靈活。

存儲區域網絡(Storage Area Network,簡稱SAN)

SAN存儲 (存儲區域網絡Storage Area Network)也即存儲區域網絡,這個是通過某種交換機(例如光纖交換機或者IB交換機等)連接存儲陣列和服務器主機等設備,形成一個專用的存儲網絡。其概念的核心是形成一個存儲網絡,該網絡是專有網絡,不同於NAS中的以太網,這種網絡往往無法與現有以太網實現互聯互通。所謂的專用存儲網絡主要體現在通信設備和協議上,目前主流的是FC-SAN,也就是基於FC設備及通信協議的存儲區域網絡。

鑑於上述缺點,後面有發展出一種基於以太網的SAN存儲形式,這個就是我們通常所說的iSCSI。這種存儲形式其實是利用TCP/IP協議實現了對SCSI協議的封裝。 主機端相當於CS架構的客戶端,而存儲端則是服務端。該種方式SAN存儲的優點是實現存儲網絡與傳統以太網的互聯互通。特別是萬兆網的普及,基於iSCSI的SAN解決方案開始大規模應用,與光纖通道技術相比較而言,這種技術具有良好的性能,而且價格低廉。

SAN存儲的隔離特性使得存儲設備可以實現更多的附加功能,從而增強存儲系統的可靠性、可用性和利用率等。比如在存儲設備端實現容災軟件,可以實時的將數據備份到其它數據中心的存儲設備。或者在存儲設備增加壓縮或者去重功能,從而提高存儲設備的利用率等。

因爲SAN解決方案是從基本功能剝離出存儲功能,所以運行備份操作就無需考慮它們對網絡總體性能的影響。SAN方案也使得管理及集中控制實現簡化,特別是對於全部存儲設備都集羣在一起的時候。最後一點,光纖接口提供了10公里的連接長度,這使得實現物理上分離的、不在機房的存儲變得非常容易。

SAN和NAS都是通過網絡的方式實現了業務服務器與存儲設備的連接和訪問,但兩者是有別的前者在業務服務器上呈現的是一個磁盤,需要格式化成文件系統後使用;而後者在業務服務器上呈現的是文件系統。

統一存儲

所謂統一存儲其實在架構上與上述兩種形式並沒有差異,只是將上述兩種方式整合到一臺物理設備中,並可以同時對外提供SAN和NAS服務。該設備的前端接口可支持FC 8Gb、iSCSI 1Gb和iSCSI 10Gb,後端具備SAS 6Gb硬盤擴展接口,可支持SAS、SATA硬盤及SSD固態硬盤具備極佳的擴展能力。實現FC SAN與IP SAN、各類存儲介質的完美融合,有效整合用戶現有存儲網絡架構,實現高性能SAN網絡的統一部署和集中管理,以適應業務和應用變化的動態需求。主機接口及硬盤接口均採用模塊化設計,更換主機接口或硬盤擴展接口,無須更換固件,可大大簡化升級維護的難度和工作量。

 

 

分佈式存儲

分佈式存儲是一種數據存儲技術,通過網絡使用企業中的每臺機器上的磁盤空間,並將這些分散的存儲資源構成一個虛擬的存儲設備,數據分散的存儲在企業的各個角落。傳統的網絡存儲系統採用集中的存儲服務器存放所有數據,存儲服務器成爲系統性能的瓶頸,也是可靠性和安全性的焦點,不能滿足大規模存儲應用的需要。分佈式網絡存儲系統採用可擴展的系統結構,利用多臺存儲服務器分擔存儲負荷,利用位置服務器定位存儲信息,它不但提高了系統的可靠性、可用性和存取效率,還易於擴展。

如圖5所示,分佈式存儲使用的設備一般是常規服務器,而非存儲設備。分佈式存儲通過非標準協議實現服務器上存儲資源的整個,並進行存儲資源池化和虛擬化處理,最後呈現給用戶某種形式(塊存儲或者文件存儲)的存儲空間。分佈式存儲有其特異性,其使用的並非標準協議,因此通常需要在應用服務器安裝其客戶端軟件實現存儲空間的虛擬呈現,以及請求的處理。

由於分佈式存儲拓撲結構的複雜性,其出現故障的概率也大大增加了。因此,對於分佈式存儲需要實現基於網絡的數據冗餘、數據保護和數據容錯等功能,確保在出現任何異常情況(例如磁盤、網卡、交換機和服務器等)下存儲系統的可用性和可靠性。

 

 

Server SAN

Server SAN其實也是分佈式存儲的一種,由於其比較新,目前沒有一個具體的定義。 Server San應該是一個利用軟件將基於DAS存儲(包含閃存卡,直連存儲)的集合,做成一個能共享的SAN存儲網絡。

SAN存儲區域網,大家都很熟悉。普遍使用的就兩種: FC SAN和ISCSI SAN。這兩種結構是通過FC網絡或者IP網絡將存儲設備放到一個共享的環境中心,讓分佈式的服務HA,應用遷移,數據複製等都可以通過這套網絡實現。但是大家注意了,這套SAN網絡是很貴的,管理起來是很麻煩的。 在很多的環境下面,很多SAN環境中會有一部分直連存儲我們根本沒有用上:比如直連存儲卡,本地硬盤等。

從實際的應用中,直連存儲的效率是很高的:PCI-E直接到數據端,比經過FC協議的轉換還要快。而且成本低。 Server SAN是一個最新的概念:將分佈在各個服務器上的直連存儲通過軟件的方式整合成一個統一的SAN存儲系統。有點類似谷歌在雲計算上做的工作,將上萬臺服務器組成一個超級計算機。 現在Server San已經不是一個概念了,在谷歌和facebook的數據中心已經大量使用了。最經典的案例就是VMware中的vSAN 了。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章