hadoop2：no job control一般解決方法

原創

LANWENBING

2020-02-21 18:13

該方法來自 http://www.350351.com/jiagoucunchu/Hadoop/310619_2.html

測試版本：CDH5.0,（Hadoop2.3）

在使用windows調用Hadoop yarn平臺的時候，一般都會遇到如下的錯誤：

2014-05-28 17:32:19,761 WARN org.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor: Exception from container-launch with container ID: container_1401177251807_0034_01_000001 and exit code: 1
org.apache.hadoop.util.Shell$ExitCodeException: /bin/bash: line 0: fg: no job control

	at org.apache.hadoop.util.Shell.runCommand(Shell.java:505)
	at org.apache.hadoop.util.Shell.run(Shell.java:418)
	at org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:650)
	at org.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor.launchContainer(DefaultContainerExecutor.java:195)
	at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:300)
	at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:81)
	at java.util.concurrent.FutureTask.run(FutureTask.java:262)
	at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1145)
	at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:615)
	at java.lang.Thread.run(Thread.java:744)

這個錯誤在Hadoop mapreduce bug的信息頁面（https://issues.apache.org/jira/browse/MAPREDUCE-5655）已經解決了，且影響的版本是Hadoop2.2、Hadoop2.3，並且已經解決（並沒有說在Hadoop2.4已經修復了）。

在http://blog.csdn.net/fansy1990/article/details/22896249 博客中，lz按照 https://issues.apache.org/jira/browse/MAPREDUCE-5655的解決方案進行了解決。這裏想給出這個問題的一般解決思路。

1. 首先這個問題是在windows的eclipse作爲客戶端提交任務到linux Hadoop集羣纔會出現的問題，如果是linux的eclipse提交任務到linux Hadoop集羣則不會出現這樣的問題。那麼一個很直觀的想法就是同時使用兩個客戶端運行一個任務，然後每個步驟都調試，來確定其中的不同點。這麼做，肯定是可以的。但是這麼做肯定也是比較費時的（而且還要自己在一個linux上裝個eclipse，麻煩）；

2. 按照1的做法，一般就可以看到有兩點的不同，一個是java命令的不同，還有一個就是classpath的不同。先說下斷點的地方：

（1）java命令的斷點：

YarnRunner.java的390行（cdh5.0 Hadoop2.3版本源碼）

// Setup the command to run the AM
    List<String> vargs = new ArrayList<String>(8);
    vargs.add(Environment.JAVA_HOME.$() + "/bin/java");

這裏打上斷點後，然後運行到445這一行，就可以看到vargs是如下的樣子（或者看vargsFinal這個變量）：

[%JAVA_HOME%, -Dlog4j.configuration=container-log4j.properties, -Dyarn.app.container.log.dir=<LOG_DIR>, -Dyarn.app.container.log.filesize=0, -Dhadoop.root.logger=INFO,CLA, , -Xmx1024m, org.apache.hadoop.mapreduce.v2.app.MRAppMaster, 1><LOG_DIR>/stdout, 2><LOG_DIR>/stderr, null, null]

（2）classpath的斷點：

YarnRunner.java的466行，查看environment的值，可以看到起值爲：

{CLASSPATH=%PWD%;$HADOOP_CONF_DIR;$HADOOP_COMMON_HOME/*;$HADOOP_COMMON_HOME/lib/*;$HADOOP_HDFS_HOME/*;$HADOOP_HDFS_HOME/lib/*;$HADOOP_MAPRED_HOME/*;$HADOOP_MAPRED_HOME/lib/*;$HADOOP_YARN_HOME/*;$HADOOP_YARN_HOME/lib/*;%HADOOP_MAPRED_HOME%\share\hadoop\mapreduce\*;%HADOOP_MAPRED_HOME%\share\hadoop\mapreduce\lib\*;job.jar/job.jar;job.jar/classes/;job.jar/lib/*;%PWD%/*}

3. 看到2中的兩個值就可以確定，windows和linux的不同之處了，主要有兩個：

（1）%%和$的區別；

（2）正反斜槓的區別（這個好像不區別也行）；
4. 看出上面兩個地方的區別後，如果直接把這兩個值改爲：

[$JAVA_HOME/bin/java -Dlog4j.configuration=container-log4j.properties -Dyarn.app.container.log.dir=<LOG_DIR> -Dyarn.app.container.log.filesize=0 -Dhadoop.root.logger=INFO,CLA  -Xmx1024m org.apache.hadoop.mapreduce.v2.app.MRAppMaster 1><LOG_DIR>/stdout 2><LOG_DIR>/stderr ]

和

{CLASSPATH=$PWD:$HADOOP_CONF_DIR:$HADOOP_COMMON_HOME/*:$HADOOP_COMMON_HOME/lib/*:$HADOOP_HDFS_HOME/*:$HADOOP_HDFS_HOME/lib/*:$HADOOP_MAPRED_HOME/*:$HADOOP_MAPRED_HOME/lib/*:$HADOOP_YARN_HOME/*:$HADOOP_YARN_HOME/lib/*:$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/*:$HADOOP_MAPRED_HOME/share/hadoop/mapreduce/lib/*:job.jar/job.jar:job.jar/classes/:job.jar/lib/*:$PWD/*}

那麼應該是可以運行的；

5. 怎麼改呢？

（1）在我們的工程中新建一個YarnRunner類，該類與源碼的YarnRunner類一模一樣（包路徑，代碼內容都一樣）；

（2）把390行替換爲（這裏默認Hadoop 集羣是在linux環境下的）：

即把

vargs.add(Environment.JAVA_HOME.$() + "/bin/java");

替換爲

vargs.add("$JAVA_HOME/bin/java");

（3）在466行添加：

replaceEnvironment(environment);

這個方法放在最後面，爲：

private void replaceEnvironment(Map<String, String> environment) {
	  String tmpClassPath = environment.get("CLASSPATH");
	  tmpClassPath=tmpClassPath.replaceAll(";", ":");
	  tmpClassPath=tmpClassPath.replaceAll("%PWD%", "\\$PWD");
	  tmpClassPath=tmpClassPath.replaceAll("%HADOOP_MAPRED_HOME%", "\\$HADOOP_MAPRED_HOME");
	  tmpClassPath= tmpClassPath.replaceAll("\\\\", "/" );
	  environment.put("CLASSPATH",tmpClassPath);
}

這樣替換完成後，在windows的eclipse中向linux Hadoop集羣中提交任務就可以執行了。

最後，在運行的時候，eclipse終端沒有日誌打印出來；直接在src下面加上一個log4j.properties文件（可以在linux 集羣的/etc/hadoop/conf/裏面下載）。

站內首發文章

LANWENBING

發佈了95 篇原創文章 · 獲贊 11 · 訪問量 25萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

hadoop2：no job control一般解決方法

linux安裝cuda和cudnn

測試人員都是畫畫大神，讓我看看誰還不會用代碼圖？

Object.values()對象遍歷

Mellanox網卡開啓SR-IOV

我拍了拍Redis，被移出了羣聊···

網絡現代化通向雲原生應用的高速公路

面試官：說說你對序列化的理解

我宣佈，這是我找到的史上AI最全論文體系！

centos 改變root用戶密碼

git 衝突解決辦法

hadoop item based collaborative filtering use case

kmeans job eclipse

weblogic + apache 配置當兩個location重疊的情況

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結