win7 系统eclipse环境下测试运行hadoop 的 wordcount mapreduce。

原創

2018-11-20 02:24

上篇介绍了在linux下测试运行 hadoop 的wordcount 例子后，就想着怎么在eclipse 下编写mapreduce函数，链接hadoop集群计算呢。
linux下测试运行 hadoop 的wordcount 参考：https://mp.csdn.net/mdeditor/84143774#
linux 部署hadoop 集群参考：https://mp.csdn.net/mdeditor/84073712#

1 下载eclipse的hadoop插件 hadoop2x-eclipse-plugin-2.6.0
https://download.csdn.net/download/qq_22830285/10792412
下载之后解压，将relase 目录下的hadoop-eclipse-plugin-2.6.0.jar 复制到eclipse的 plugin 目录下、

2.重起运行eclipse，打开菜单Window->ShowView->Other,显示如

3、new hadoop lacation 配置elcipse 与hadoop 的链接。填完之后，点击finish.
/4、保存完配置之后，可以看到project explorer ，新增了一个 DFS location.
/5、如果出现下面错误的话，在系统环境变量添加HADOOP_USER_NAME=root环境变量，或者win系统的用户名改为root,又或者修改hadoop 的hdfs-site文件中添加以下内容，关闭权限检查，即解决了上述问题。

<property>
        <name>dfs.permissions</name>
        <value>false</value>
 </property>

/6、新建立项目map/reduce 项目
创建 map 函数，WordCountMap 类如下

import java.io.IOException;
import java.util.StringTokenizer;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;

public class WordCountMap extends Mapper<LongWritable, Text, Text, IntWritable> {
	  private final IntWritable one = new IntWritable(1);
      private Text word = new Text();
      
      public void map(LongWritable key, Text value, Context context)
              throws IOException, InterruptedException {
          String line = value.toString();
          StringTokenizer token = new StringTokenizer(line);
          while (token.hasMoreTokens()) {
              word.set(token.nextToken());
              context.write(word, one);
          }
      }
}

创建reduce 函数，WordCountReduce

import java.io.IOException;

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Reducer;

public class WordCountReduce extends Reducer<Text, IntWritable, Text, IntWritable> {
	  public void reduce(Text key, Iterable<IntWritable> values, Context context) throws IOException, InterruptedException {
          int sum = 0;
          for (IntWritable val : values) {
              sum += val.get();
          }
          context.write(key, new IntWritable(sum));
      }
}

创建wordcount mian ，WordCountTest

import org.apache.hadoop.fs.Path;
import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Job;
import org.apache.hadoop.mapreduce.lib.input.FileInputFormat;
import org.apache.hadoop.mapreduce.lib.input.TextInputFormat;
import org.apache.hadoop.mapreduce.lib.output.FileOutputFormat;
import org.apache.hadoop.mapreduce.lib.output.TextOutputFormat;

public class WordCountTest {
    @SuppressWarnings("deprecation")
    public static void main(String[] args) throws Exception{
       // Configuration conf = new Configuration();
        Job job = new Job();
        job.setJarByClass(WordCountTest.class);
        job.setJobName("wordcount");
        job.setOutputKeyClass(Text.class);
        job.setOutputValueClass(IntWritable.class);
        job.setMapperClass(WordCountMap.class); 
        job.setReducerClass(WordCountReduce.class);
        job.setInputFormatClass(TextInputFormat.class);
        job.setOutputFormatClass(TextOutputFormat.class);
        //输入文件路径，我的a.txt,b.txt 文件放在hdfs系统下的 user/root/input 目录下
        FileInputFormat.addInputPath(job, new Path("hdfs://192.168.80.130:9000/user/root/input"));
       //计算结果输出文件路径，记住，此路径不能存在，否则会报错
        FileOutputFormat.setOutputPath(job, new Path("hdfs://192.168.80.130:9000/user/root/out3"));
        job.waitForCompletion(true)
    }
}

然后运行，WordCountTest 类。
run as -->run on hadoop
/7、也许，看不到控制台的日志，那么将hadoop 的log4j.properties文件复制工程src 目录下。

/8.运行之后DFS相应的目录下看到输出结果。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

win7 系统eclipse环境下测试运行hadoop 的 wordcount mapreduce。

Nginx R31 doc 官方文档-01-nginx 如何安装

挑战程序设计竞赛 2.2章习题 POJ - 3617 Best Cow Line 贪心

字节面试：MySQL什么时候锁表？如何防止锁表？

.NET8连接SQL SERVER 2008 R2 报：证书链是由不受信任的颁发机构颁发的

golang开发环境搭建(win10)

python计算机视觉学习笔记——PIL库的用法

java springBoot 中調用 Matlab軟件進行二維矩陣計算 matlabcontrol

HBase安裝到HA集羣

hadoop + zookeeper HA架構搭建

eclipse 使用maven構建簡單的項目工程操作hadoop HDFSS

Failed to start namenode. java.net.SocketException: Unresolved address

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

win7 系统eclipse环境下测试 运行hadoop 的 wordcount mapreduce。

win7 系统eclipse环境下测试运行hadoop 的 wordcount mapreduce。