大數據筆記06--YARN的搭建與測試

yarn的搭建

集羣規劃

在這裏插入圖片描述

配置

  1. 修改配置文件mapred-sitex.xml
<property>
	<name>mapreduce.framework.name</name>
	<value>yarn</value>
</property>
<-- 跨平臺配置 -->
 <property>
	<name>mapreduce.app-submission.cross-platform</name>
	<value>true</value>
</property>
  1. 修改配置文件yarn-site.xml
 <property>
	<name>yarn.nodemanager.aux-services</name>
	<value>mapreduce_shuffle</value>
</property>
<property>
	<name>yarn.resourcemanager.ha.enabled</name>
	<value>true</value>
 </property>
 <property>
	<name>yarn.resourcemanager.cluster-id</name>
	<value>cluster1</value>
 </property>
 <property>
	<name>yarn.resourcemanager.ha.rm-ids</name>
	<value>rm1,rm2</value>
 </property>
 <property>
	<name>yarn.resourcemanager.hostname.rm1</name>
	<value>node01</value>
 </property>
 <property>
	<name>yarn.resourcemanager.hostname.rm2</name>
	<value>node02</value>
 </property>
 <property>
	<name>yarn.resourcemanager.zk-address</name>
	<value>node02:2181,node03:2181,node04:2181</value>
 </property>
  1. 將配置好信息分發到所有節點
  2. 在node02 node03 node04上啓動zookeeper
./zkServer.sh start
  1. node01上啓動hdfs和yarn集羣
start-dfs.sh

start-yarn.sh
  1. 在node02上單獨啓動一個備用ResourceManager
    (node01上已自動啓動一個active的RM)
yarn-daemon.sh start resourcemanager
  1. 從8088端口查看管理頁面

測試案例

wordcount

使用MapReduce提供的測試用例wordcount

  1. 到mapreduce的jar包目錄下
cd $HADOOP_HOME/share/hadoop/mapreduce
  1. 運行測試用例
hadoop jar hadoop-mapreduce-examples-2.6.5.jar wordcount  /input  /output
  • input:是hdfs文件系統中數據所在的目錄
  • ouput:是hdfs中不存在的目錄,程序運行的結果會輸出到該目錄,若目錄存在會報錯
  1. 查看運行結果
hdfs dfs -cat /output/*
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章