Linux高性能計算集羣 -- Beowulf集羣(1)

Linux高性能計算集羣 -- Beowulf集羣

1 集羣

1.1 什麼是集羣

簡單的說,集羣(cluster)就是一組計算機,它們作爲一個整體向用戶提供一組網絡資源。這些單個的計算機系統就是集羣的節點(node)。一個理想的集羣是,用戶從來不會意識到集羣系統底層的節點,在他/她們看來,集羣是一個系統,而非多個計算機系統。並且集羣系統的管理員可以隨意增加和刪改集羣系統的節點。

1.2 爲什麼需要集羣

集羣並不是一個全新的概念,其實早在七十年代計算機廠商和研究機構就開始了對集羣系統的研究和開發。由於主要用於科學工程計算,所以這些系統並不爲大家所熟知。直到Linux集羣的出現,集羣的概念才得以廣爲傳播。

對集羣的研究起源於集羣系統的良好的性能可擴展性(scalability)。提高CPU主頻和總線帶寬是最初提供計算機性能的主要手段。但是這一手段對系統性能的提供是有限的。接着人們通過增加CPU個數和內存容量來提高性能,於是出現了向量機,對稱多處理機(SMP)等。但是當CPU的個數超過某一閾值,象SMP這些多處理機系統的可擴展性就變的極差。主要瓶頸在於CPU訪問內存的帶寬並不能隨着CPU個數的增加而有效增長。與SMP相反,集羣系統的性能隨着CPU個數的增加幾乎是線性變化的。圖1顯示了這中情況。

wKioL1LdHRTziWa5AACmMy8KU4M682.jpg

1. 幾種計算機系統的可擴展性

集羣系統的優點並不僅在於此。下面列舉了集羣系統的主要優點:

1.高可擴展性:如上所述。

2.高可用性:集羣中的一個節點失效,它的任務可以傳遞給其他節點。可以有效防止單點失效。

3.高性能:負載平衡集羣允許系統同時接入更多的用戶。

4.高性價比:可以採用廉價的符合工業標準的硬件構造高性能的系統。

1.2.1 集羣系統的分類

雖然根據集羣系統的不同特徵可以有多種分類方法,但是一般我們把集羣系統分爲兩類:

  • 高可用(High Availability)集羣,簡稱HA集羣。這類集羣致力於提供高度可靠的服務。

  • 高性能計算(High Perfermance Computing)集羣,簡稱HPC集羣。這類集羣致力於提供單個計算機所不能提供的強大的計算能力。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章