核心組成:
HDFS:分佈式文件系統,存儲海量數據;
MapReduce:並行處理框架,實現任務分解和調度;
能做什麼?
大型數據倉庫…..
優勢1:
高擴展
低成本
成熟的生態圈:
Hadoop的應用範圍較廣:Facebook、Google等等;
Hadoop ecosystem 生態系統:
- Hive 將SQL轉化爲Hadoop任務,降低使用Hadoop的門檻;
- Hbase 存儲結構化數據的數據(無事物特性),數據隨機讀寫和實時訪問
- zookeeper 監控Hadoop集羣中節點的狀態、集羣的一致性;