初識Hadoop
Hadoop是一個由Apache基金會所開發的分佈式系統基礎架構。用戶可以在不瞭解分佈式底層細節的情況下,開發分佈式程序。充分利用集羣的威力進行運行和存儲。
Hadoop中最重要的兩個設計是:HDFS和MapReduce,其中HDFS爲海量的數據提供了存儲,而MapReduce則爲海量的數據提供了計算。
可以說Hadoop是大數據時代分析海量數據的一大利器,在系列博客中將介紹 Hadoop的安裝, 使用方法和使用技巧。
-
安裝具體介紹,如何在win10系統中安裝VMware虛擬機並安裝一個已經含有Hadoop的Linux系統
-
使用方法將具體介紹,虛擬機中Hadoop的使用方法,語法等,這部分知識會比較成體系,有沒有辦法進入體系的就放在使用技巧中介紹
-
使用技巧將記錄我在使用Hadoop時所積累的不成體系的小技巧等,這部分會長期更新,也歡迎更多的朋友們與我討論