初識大數據(一)-----Hadoop基本概念

1、Hadoop是什麼?
Hadoop是一個開源的分佈式存儲和分佈式計算平臺
包括兩個核心組成:
1)HDFS: 分佈式文件系統,存儲海量的數據
2)MapReduce: 並行處理框架,實現任務分解和調度

2、hadoop用來做什麼?
1)搭建大型數據倉庫,PB級的存儲,處理,分析,統計等業務
主要用於搜索引擎,日誌分析,商業智能,數據挖掘

3、hadoop的優勢:
1)高擴展
2)低成本
3)成熟的生態圈

hadoop的生態系統
1、hive:
可以將sql語句轉換成hadoop任務去執行,比較輕盈
2、hbase
存儲結構化數據的分佈式數據庫,
與傳統數據庫不同,放棄了事物特性,追求更高的擴展;
與HDFS不同,提供數據的隨機讀寫和實時訪問,實現對錶數據的讀寫功能
3、zookeeper
監控集羣節點之間的狀態,管理集羣的配置,維護節點之間的一致性

欲瞭解更多hadoop的相關知識,請關注公衆號:架構師Plus在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章