hadoop windows setup

準備步驟:
1.eclipse安裝程序(我的是3.7).

2.eclipse和hadoop的插件安裝包:hadoop-0.20.3-dev-eclipse-plugin.jar.

3.hadoop 的安裝包我用的是:hadoop-0.20.2 版本.

4.cygwin 虛擬linux環境.http://www.cygwin.com/setup.exe


eclipse下配置hadoop步驟:
1.將 hadoop-0.20.3-dev-eclipse-plugin.jar放到到 eclipse安裝目錄/plugins/ 下。

2.重啓eclipse,配置hadoop installation directory。

如果安裝插件成功,打開Window-->Preferens,你會發現Hadoop Map/Reduce選項,在這個選項裏你需要配置Hadoop installation directory。配置完成後退出。

3.配置Map/Reduce Locations。
在Window-->Show View中打開Map/Reduce Locations。
在Map/Reduce Locations中新建一個Hadoop Location。在這個View中,右鍵-->New Hadoop Location。在彈出的對話框中你需要配置Location name,如myubuntu,還有Map/Reduce Master和DFS Master。這裏面的Host、Port分別爲mapred-site.xml、core-site.xml中配置的地址及端口。

4.新建項目。
File-->New-->Other-->Map/Reduce Project
項目名可以隨便取,如hadoop-test。
複製 hadoop安裝目錄/src/example/org/apache/hadoop/example/的demo到剛纔新建的項目下面。

5.上傳模擬數據文件夾。
爲了運行程序,我們需要一個輸入的文件夾,和輸出的文件夾。輸出文件夾,在程序運行完成後會自動生成。我們需要給程序一個輸入文件夾。
在當前目錄(如hadoop安裝目錄)下新建文件夾input,並在文件夾下新建兩個文件file,內容如下:
file:Hello Hadoop Goodbye Hadoop
6.運行項目。
a..在新建的項目hadoop-test,點擊WordCount.java,右鍵-->Run As-->Run Configurations
b..在彈出的Run Configurations對話框中,點Java Application,右鍵-->New,這時會新建一個application名爲WordCount
c..配置運行參數,點Arguments,在Program arguments中輸入“你要傳給程序的輸入文件夾和你要求程序將計算結果保存的文件夾”,如
  1. hdfs://localhost:9000/user/Administrator/input01 hdfs://localhost:9000/user/Administrator/output01  
  1. hdfs://localhost:9000/user/Administrator/input01 hdfs://localhost:9000/user/Administrator/output01  

7.點擊Run on hadoop,運行程序。
8.等運行結束後,可以在終端中用命令bin/hadoop fs -cat output01/*  查看生成的文件內容。


注意點:
1.如果插件安裝完成之後,無法正常使用,總是報錯。建議使用新的eclipse或者是新的插件

2.在配置hadoop的時候,注意其中文件的描述要正確,主機和端口。


如果不想麻煩:可以使用hadoop4win來嘗試。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章