分佈式集羣中的硬件選擇

一、背景

最近2個月時間一直在一個陰暗的地下室的角落裏工作,主要內容就是hadoop相關的應用。在這期間,Hadoop的應用確實得到認可,但是同時也帶來了一些問題,軟件方面我就不在這裏說了,只說說一些物理方面的侷限:

1、衆所周知,hadoop能夠接受任何類型的機器加入集羣,在多不在精。但是這帶來一個問題,機房的空間開銷以及電費。

2、機器太多,人力維護成本也是增加的。機櫃啊、物理空間都是個不小的負擔和開銷。

剛好,在這個問題產生的同時,十分幸運的被一同事叫出來,去參加一個會議,得以有機會走上地面。這個會議是個聯合性質的,多個公司的人在一起。其中有一家公司在海量數據計算方面力推hadoop,並做了比較好的配套開發工作。比如工作流、數據清洗過濾、輸出數據管理等。其實這些應用模型都大同小異。但最引起我關注的是他們的硬件方面的選型,確實很有新意(當然,可能由於我對硬件不熟悉,說的不對還望朋友們別笑話)。

二、具體內容

在昨天會議上,對方提到了自己採用的硬件設備,能很好的解決物理空間和維護成本的問題(當然,我也碰到不在乎空間和電費的主。地方有的是,就是希望把以前淘汰的機器都用上)。他們的機器類型是一款2U的設備,在這個2U的機器上集成了4塊主板,12塊硬盤。什麼意思呢,說白了,就是把4臺機器集成到了一個2U的設備上。除了電源共用(沒問電源多少瓦的,一激動,忘記問了),其他都是獨立的。這樣的機器類型大大的節約了物理空間。試想一下,一個機櫃10臺2U設備,傳統的只能存放10臺節點機器。如果換成這樣的2U設備,可以存放4×10=40臺節點機器,空間利用縮小,這樣的機器我覺得還是很客觀的。

三、總結

1、我不是在做廣告,只是覺得這樣的硬件類型確實是很適合hadoop集羣的使用。

2、硬件方面我不是很熟悉,可能熟悉硬件的朋友對這個都比較瞭解了,所以我說錯了還望指出來。

3、分佈式計算的集羣確實可以很好的解決海量計算問題,但是帶來規模龐大的硬件數量確實在空間和電費上是個挑戰。

4、寫的不對或是有爭議的地方,隨時歡迎大家發郵件討論:[email protected]

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章