自學大數據(二)

學習方向

大數據解決了什麼問題?

大數據需要解決得幾個問題是

  • 採集
  • 存儲
  • 計算
  • 展示
數據採集

說到數據採集就需要說到數據來源。數據無非來源於各種數據庫,以及文件。那麼就需要有提供一種這樣得工具能從各個地方獲取數據輸入,並輸出到HDFS中。
相信大家都接觸過elk。也一定知道logstash。所以這裏我推薦大家學習兩個採集方案

  • 方案一、filebeat+kafka+logstash。
  • 方案二、flume+kafka
數據存儲

Hadoop體系下:文件系統HDFS,依託於HDFS之上的有Hive、Hbase存儲系統
Google體系下:文件系統GFS,依託於GFS之上的有bigTable存儲系統

數據計算

數據的計算無可厚非就是分佈式計算Map/Reduce。基於MapReduce上的計算引擎有Storm、Spark、Flink.

數據展示

展示自不必說了,大家想怎麼展示就怎麼展示了。當然如果你也可以使用一些第三方高大上的工具比如阿里的dataV、granfana,或者自己寫的web。

總結

以上就是大數據體系下的核心技術,如果想學習大數據,就按以上技術體系深入瞭解就行了。

發佈了119 篇原創文章 · 獲贊 28 · 訪問量 4萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章