大數據 - 第七課：eclipse開發環境配置

原創

陈杉菜

2020-04-29 03:22

eclipse開發環境配置
下載，解壓eclipse，驗證是否能夠正常運行。
將hadoop-eclipse-plugin-2.6.0.jar拷貝到eclipse的dropins文件夾下。如果已經啓動了eclipse，需要關閉重啓eclipse。
備註：應當使用hadoop2.7.7的插件，但是我沒有下載到，只是上課時演示過程。
1.1配置hadoop路徑
在主菜單上選擇“window”，如下圖，然後選擇“Preferences”。

在如下界面左邊選擇“HadoopMap/Reduce”，在右邊輸入Hadoop的路徑（hadoop_home路徑）。輸入後點擊“Apply and Close”。

1.2 配置Map/Reduce Locations
如下圖，從主菜單開始，然後選擇“Other”。

在以下界面中選擇“Map/Reduce Locations”，然後點擊”Open”。

點擊界面右側上方的
，新建hadoop location。

在此頁面上，Location name欄輸入名字，隨便一個字符串都可以，除了系統保留字。
Map/Reduce(V2) Master標籤頁中，Host要輸入master節點的ip地址，我當前master節點ip地址是10.0.0.20；Port要根據配置文件輸入。打開mapred-site.xml：

此文件中沒有Map/Reduce的端口配置，只是指定了用yarn進行管理，所以需要打開yarn-site.xml:

可填入如上兩個端口中的一個。
DFS Master標籤頁中，端口號也需要根據配置文件填入，打開dfs配置文件hdfs-site.xml，發現文件內容裏沒有相應的端口號配置，打開core-site.xml

可以看到端口號是9000。按照我的集羣配置，填好後如下圖。點擊右下角“Finish”。

配置完成後，界面上會出現如下圖內容：

建立java的project
從主菜單開始，如下圖所示，然後選擇“Other”。

給自己的project起個名字，然後點擊“Finish”。
3. WordCount程序解釋
3.1 main方法
public static void main(String[] args) throws Exception {
從main程序看，運行時需要輸入參數，參數類型是String[]，由於形參數組大小不定，是根據實參確定的，所以，輸入的數組元素的個數任意。
輸入參數的意義？
Main的輸入參數是文件路徑，其中最後一個是輸出文件的路徑，其他的是輸入文件的路徑。
3.2 TokenizerMapper

3.3 IntSumReducer

下次課運行

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

大數據 - 第七課：eclipse開發環境配置

爲什麼要⽤ Foundry

【筆記】動手學深度學習-預備知識

py發送email

MySQL 分庫分表方案，總結太全了。。

Qt/C++音視頻開發71-指定mjpeg/h264格式採集本地攝像頭/存儲文件到mp4/設備推流/採集推流

WPF開源輕便、快速的桌面啓動器

公司來了個新同事，把 DDD 運用得爐火純青！

python - 作業13：打地鼠小遊戲（附代碼）

大數據： CenOS7虛擬機添加新用戶&給新用戶增加權限

Python matplotlib 繪圖報錯：No handles with labels found to put in legend 解決辦法

Android開發 - eclipse設置程序運行後默認第一個運行的java文件定時頁面跳轉示例（附代碼)

大數據 - 第五課：配置Hadoop集羣

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

大數據 - 第七課 ：eclipse開發環境配置

大數據 - 第七課：eclipse開發環境配置