弄清Spark、Storm、MapReduce的這幾點區別才適合學習大數據

原創

2018-09-11 07:28

很多初學者在剛剛接觸大數據的時候會有很多疑惑，比如對MapReduce、Storm、Spark三個計算框架的理解經常會產生混亂。

哪一個適合對大量數據進行處理？哪一個又適合對實時的流數據進行處理？又該如何來區分他們呢？

我對比整理了這3個計算框架的基本知識，大家可以瞭解一下以便對這個3個計算框架有一個整體的認識。

MapReduce

Spark

Storm是一個分佈式的、可靠的、容錯的流式計算框架。
Storm 一開始就是爲實時處理設計，因此在實時分析/性能監測等需要高時效性的領域廣泛採用。
Storm在理論上支持所有語言，只需要少量代碼即可完成適配。
Storm把集羣的狀態存在Zookeeper或者本地磁盤，所以後臺進程都是無狀態的（不需要保存自己的狀態，都在zookeeper上），可以在不影響系統健康運行的同時失敗或重啓。
Storm可應用於--數據流處理、持續計算（持續地向客戶端發送數據，它們可以實時的更新以及展現數據，比如網站指標）、分佈式遠程過程調用（輕鬆地並行化CPU密集型操作）。

如何用4個月學會Hadoop開發並找到年薪25萬工作？

免費分享一套17年最新Hadoop大數據教程和100道Hadoop大數據必會面試題。

因爲鏈接經常被和諧，需要的朋友請加微信 55723447 來獲取最新下載鏈接，註明“51CTO”

教程已幫助300+人成功轉型Hadoop開發，90%起薪超過20K，工資比之前翻了一倍。

由百度Hadoop核心架構師（T7級別）親自錄製。

內容包括0基礎入門、Hadoop生態系統、真實商業項目實戰3大部分。其中商業案例可以讓你接觸真實的生產環境，訓練自己的開發能力。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.