學習方向
大數據解決了什麼問題?
大數據需要解決得幾個問題是
- 採集
- 存儲
- 計算
- 展示
數據採集
說到數據採集就需要說到數據來源。數據無非來源於各種數據庫,以及文件。那麼就需要有提供一種這樣得工具能從各個地方獲取數據輸入,並輸出到HDFS中。
相信大家都接觸過elk。也一定知道logstash。所以這裏我推薦大家學習兩個採集方案
- 方案一、filebeat+kafka+logstash。
- 方案二、flume+kafka
數據存儲
Hadoop體系下:文件系統HDFS,依託於HDFS之上的有Hive、Hbase存儲系統
Google體系下:文件系統GFS,依託於GFS之上的有bigTable存儲系統
數據計算
數據的計算無可厚非就是分佈式計算Map/Reduce。基於MapReduce上的計算引擎有Storm、Spark、Flink.
數據展示
展示自不必說了,大家想怎麼展示就怎麼展示了。當然如果你也可以使用一些第三方高大上的工具比如阿里的dataV、granfana,或者自己寫的web。
總結
以上就是大數據體系下的核心技術,如果想學習大數據,就按以上技術體系深入瞭解就行了。