MPP大規模並行計算數據庫與分佈式數據庫的區別

最近調研分佈式TP數據庫。結合公司使用的MPP數據庫,一度感覺兩者很像,隨着分佈式的深入研究,結合行內MPP數據庫使用過正中遇到的問題,簡單的總結一下分佈式數據庫與MPP數據庫的區別。

分佈式數據庫系統與並行數據庫系統MPPDB有許多相似點,如都有用網絡連接各個數據處理結點的特點。網絡中的所有結點構成一個邏輯上的統一整體,用戶可以對各個結點上的數據進行透明存取等等。

由於分佈式數據庫系統和並行數據庫系統的應用目標和具體實現方法不同,因爲它們之間也具有很大的不同,主要有以下幾點:

(1) 應用目標不同。

       並行數據庫系統的目標是充分發揮並行計算機的優勢,利用系統中的各個處理機結點並行完成數據庫任務,提高數據庫系統的整體性能。分佈式數據庫系統主要目的在於實現場地自治和數據的全局透明共享,而不要求利用網絡中的各個結點來提高系統處理性能。

(2) 實現方式不同

       在具體實現方法上,並行數據庫系統與分佈式數據庫系統也有着較大的不同。在並行數據庫系統中,爲了充分利用各個結點的處理能力,各結點間可以採用高速網絡連接。結點鍵的數據傳輸代價相對較低,當某些結點處於空閒狀態時,可以將工作負載過大的結點上的部分任務通過高速網傳送給空閒結點處理,從而實現系統的負載平衡。存在硬盤及機器的木桶效應。(有最短板決定集羣的整個性能,及空間大小。

但是在分佈式數據庫系統中,爲了適應應用的需要,滿足數據分佈特點的需要,各結點間一般採用局域網或廣域網相連,網絡帶寬較低,結點間的通信開銷較大。因此,在查詢處理時一般應儘量減少結點間的數據傳輸量是一個統一透明的數據庫。完全可以當成一個數據庫來用。不用關心數據如何分佈存儲。

(3) 各結點的地位不同。

並行數據庫系統中,各結點是完全非獨立的,不存在全局應用和局部應用的概念,在數據處理中只能發揮協同作用,而不能有局部應用。

分佈式數據庫系統中,各結點除了能通過網絡協同完成全局事務外,各結點具有場地自治性,每個場地使獨立的數據庫系統。每個場地有自己的數據庫、客戶、CPU等資源,運行自己的DBMS,執行局部應用,具有高度的自治性

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章