服務器三大體系 SMP、NUMA、MPP 之詳解

系統架構來看,目前的商用服務器大體可以分爲三類

    對稱多處理器結構(SMP:Symmetric Multi-Processor);

    非一致存儲訪問結構(NUMA:Non-Uniform Memory Access);

    海量並行處理結構(MPP:Massive Parallel Processing);


共享存儲型多處理機有兩種模型

  • 均勻存儲器存取(Uniform-Memory-Access,簡稱UMA)模型

  • 非均勻存儲器存取(Nonuniform-Memory-Access,簡稱NUMA)模型


SMP(Symmetric Multi-Processor)

    所謂對稱多處理器結構,是指服務器中多個CPU對稱工作,無主次或從屬關係。各CPU共享相同的物理內存,每個 CPU訪問內存中的任何地址所需時間是相同的,因此SMP也被稱爲一致存儲器訪問結構(UMA:Uniform Memory Access)。對SMP服務器進行擴展的方式包括增加內存、使用更快的CPU、增加CPU、擴充I/O(槽口數與總線數)以及添加更多的外部設備(通常是磁盤存儲)。

    SMP服務器的主要特徵是共享,系統中所有資源(CPU、內存、I/O等)都是共享的。也正是由於這種特徵,導致了SMP服務器的主要問題,那就是它的擴展能力非常有限。對於SMP服務器而言,每一個共享的環節都可能造成SMP服務器擴展時的瓶頸,而最受限制的則是內存。由於每個CPU必須通過相同的內存總線訪問相同的內存資源,因此隨着CPU數量的增加,內存訪問衝突將迅速增加,最終會造成CPU資源的浪費,使 CPU性能的有效性大大降低。實驗證明,SMP服務器CPU利用率最好的情況是2至4個CPU。

圖1.SMP服務器CPU利用率狀態


NUMA(Non-Uniform Memory Access)

    由於SMP在擴展能力上的限制,人們開始探究如何進行有效地擴展從而構建大型系統的技術,NUMA就是這種努力下的結果之一。利用NUMA技術,可以把幾十個CPU(甚至上百個CPU)組合在一個服務器內。其CPU模塊結構如圖2所示:

圖2.NUMA服務器CPU模塊結構

    NUMA服務器的基本特徵是具有多個CPU模塊,每個CPU模塊由多個CPU(如4個)組成,並且具有獨立的本地內存、I/O槽口等。由於其節點之間可以通過互聯模塊(如稱爲Crossbar Switch)進行連接和信息交互,因此每個CPU可以訪問整個系統的內存(這是NUMA系統與MPP系統的重要差別)。顯然,訪問本地內存的速度將遠遠高於訪問遠地內存(系統內其它節點的內存)的速度,這也是非一致存儲訪問NUMA的由來。由於這個特點,爲了更好地發揮系統性能,開發應用程序時需要儘量減少不同CPU模塊之間的信息交互。利用NUMA技術,可以較好地解決原來SMP系統的擴展問題,在一個物理服務器內可以支持上百個CPU。比較典型的NUMA服務器的例子包括HP的Superdome、SUN15K、IBMp690等。

    但NUMA技術同樣有一定缺陷,由於訪問遠地內存的延時遠遠超過本地內存,因此當CPU數量增加時,系統性能無法線性增加。如HP公司發佈Superdome服務器時,曾公佈了它與HP其它UNIX服務器的相對性能值,結果發現,64路CPU的Superdome (NUMA結構)的相對性能值是20,而8路N4000(共享的SMP結構)的相對性能值是6.3。從這個結果可以看到,8倍數量的CPU換來的只是3倍性能的提升。

圖3.MPP服務器架構圖


MPP(Massive Parallel Processing)

    和NUMA不同,MPP提供了另外一種進行系統擴展的方式,它由多個SMP服務器通過一定的節點互聯網絡進行連接,協同工作,完成相同的任務,從用戶的角度來看是一個服務器系統。其基本特徵是由多個SMP服務器(每個SMP服務器稱節點)通過節點互聯網絡連接而成,每個節點只訪問自己的本地資源(內存、存儲等),是一種完全無共享(Share Nothing)結構,因而擴展能力最好,理論上其擴展無限制,目前的技術可實現512個節點互聯,數千個CPU。目前業界對節點互聯網絡暫無標準,如 NCR的Bynet,IBM的SPSwitch,它們都採用了不同的內部實現機制。但節點互聯網僅供MPP服務器內部使用,對用戶而言是透明的。

    在MPP系統中,每個SMP節點也可以運行自己的操作系統、數據庫等。但和NUMA不同的是,它不存在異地內存訪問的問題。換言之,每個節點內的CPU不能訪問另一個節點的內存。節點之間的信息交互是通過節點互聯網絡實現的,這個過程一般稱爲數據重分配(Data Redistribution)。

    但是MPP服務器需要一種複雜的機制來調度和平衡各個節點的負載和並行處理過程。目前一些基於MPP技術的服務器往往通過系統級軟件(如數據庫)來屏蔽這種複雜性。舉例來說,NCR的Teradata就是基於MPP技術的一個關係數據庫軟件,基於此數據庫來開發應用時,不管後臺服務器由多少個節點組成,開發人員所面對的都是同一個數據庫系統,而不需要考慮如何調度其中某幾個節點的負載。


NUMA與MPP的區別

    從架構來看,NUMA與MPP具有許多相似之處:它們都由多個節點組成,每個節點都具有自己的CPU、內存、I/O,節點之間都可以通過節點互聯機制進行信息交互。那麼它們的區別在哪裏?通過分析下面NUMA和MPP服務器的內部架構和工作原理不難發現其差異所在。

    首先是節點互聯機制不同,NUMA的節點互聯機制是在同一個物理服務器內部實現的,當某個CPU需要進行遠地內存訪問時,它必須等待,這也是NUMA服務器無法實現CPU增加時性能線性擴展的主要原因。而MPP的節點互聯機制是在不同的SMP服務器外部通過I/O 實現的,每個節點只訪問本地內存和存儲,節點之間的信息交互與節點本身的處理是並行進行的。因此MPP在增加節點時性能基本上可以實現線性擴展。

    其次是內存訪問機制不同。在NUMA服務器內部,任何一個CPU可以訪問整個系統的內存,但遠地訪問的性能遠遠低於本地內存訪問,因此在開發應用程序時應該儘量避免遠地內存訪問。在MPP服務器中,每個節點只訪問本地內存,不存在遠地內存訪問的問題。


MPP和SMP、NUMA應用之間的區別

MPP的優勢

    MPP系統不共享資源,因此對它而言,資源比SMP要多,當需要處理的事務達到一定規模時,MPP的效率要比SMP好。由於MPP系統因爲要在不同處理單元之間傳送信息,在通訊時間少的時候,那MPP系統可以充分發揮資源的優勢,達到高效率。也就是說:操作相互之間沒有什麼關係,處理單元之間需要進行的通信比較少,那採用MPP系統就要好。因此,MPP系統在決策支持和數據挖掘方面顯示了優勢。

SMP的優勢

    MPP系統因爲要在不同處理單元之間傳送信息,所以它的效率要比SMP要差一點。在通訊時間多的時候,那MPP系統可以充分發揮資源的優勢。因此當前使用的OTLP程序中,用戶訪問一箇中心數據庫,如果採用SMP系統結構,它的效率要比採用MPP結構要快得多。

NUMA架構的優勢

    NUMA架構來看,它可以在一個物理服務器內集成許多CPU,使系統具有較高的事務處理能力,由於遠地內存訪問時延遠長於本地內存訪問,因此需要儘量減少不同CPU模塊之間的數據交互。顯然,NUMA架構更適用於OLTP事務處理環境,當用於數據倉庫環境時,由於大量複雜的數據處理必然導致大量的數據交互,將使CPU的利用率大大降低


數據倉庫的選擇

    哪種服務器更加適應數據倉庫環境?這需要從數據倉庫環境本身的負載特徵入手。衆所周知,典型的數據倉庫環境具有大量複雜的數據處理和綜合分析,要求系統具有很高的I/O處理能力,並且存儲系統需要提供足夠的I/O帶寬與之匹配。而一個典型的OLTP系統則以聯機事務處理爲主,每個交易所涉及的數據不多,要求系統具有很高的事務處理能力,能夠在單位時間裏處理儘量多的交易。顯然這兩種應用環境的負載特徵完全不同。

    從NUMA架構來看,它可以在一個物理服務器內集成許多CPU,使系統具有較高的事務處理能力,由於遠地內存訪問時延遠長於本地內存訪問,因此需要儘量減少不同CPU模塊之間的數據交互。顯然,NUMA架構更適用於OLTP事務處理環境,當用於數據倉庫環境時,由於大量複雜的數據處理必然導致大量的數據交互,將使CPU的利用率大大降低。

    相對而言,MPP服務器架構的並行處理能力更優越,更適合於複雜的數據綜合分析與處理環境。當然,它需要藉助於支持MPP技術的關係數據庫系統來屏蔽節點之間負載平衡與調度的複雜性。另外,這種並行處理能力也與節點互聯網絡有很大的關係。顯然,適應於數據倉庫環境的MPP服務器,其節點互聯網絡的I/O性能應該非常突出,才能充分發揮整個系統的性能。

    相信夢想是價值的源泉,相信眼光決定未來的一切,相信成功的信念比成功本身更重要,相信人生有挫折沒有失敗,相信生命的質量來自決不妥協的信念!——I`m geek!
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章