1.eclipse安裝程序(我的是3.7).
2.eclipse和hadoop的插件安裝包:hadoop-0.20.3-dev-eclipse-plugin.jar.
3.hadoop 的安裝包我用的是:hadoop-0.20.2 版本.
4.cygwin 虛擬linux環境.http://www.cygwin.com/setup.exe
在Window-->Show View中打開Map/Reduce Locations。
在Map/Reduce Locations中新建一個Hadoop Location。在這個View中,右鍵-->New Hadoop Location。在彈出的對話框中你需要配置Location name,如myubuntu,還有Map/Reduce Master和DFS Master。這裏面的Host、Port分別爲mapred-site.xml、core-site.xml中配置的地址及端口。
File-->New-->Other-->Map/Reduce Project
項目名可以隨便取,如hadoop-test。
複製 hadoop安裝目錄/src/example/org/apache/hadoop/example/的demo到剛纔新建的項目下面。
5.上傳模擬數據文件夾。
爲了運行程序,我們需要一個輸入的文件夾,和輸出的文件夾。輸出文件夾,在程序運行完成後會自動生成。我們需要給程序一個輸入文件夾。
在當前目錄(如hadoop安裝目錄)下新建文件夾input,並在文件夾下新建兩個文件file,內容如下:
a..在新建的項目hadoop-test,點擊WordCount.java,右鍵-->Run As-->Run Configurations
b..在彈出的Run Configurations對話框中,點Java Application,右鍵-->New,這時會新建一個application名爲WordCount
c..配置運行參數,點Arguments,在Program arguments中輸入“你要傳給程序的輸入文件夾和你要求程序將計算結果保存的文件夾”,如
- hdfs://localhost:9000/user/Administrator/input01 hdfs://localhost:9000/user/Administrator/output01
- hdfs://localhost:9000/user/Administrator/input01 hdfs://localhost:9000/user/Administrator/output01