Hadoop集羣配置、啓動YARN

原創

Bì须的毕

2020-06-07 14:52

本篇在 Hadoop集羣啓動HDFS 的基礎上繼續配置

YARN啓動：

配置mapred-site.xml（複製mapred-site.xml.template配置模板生成mapred-site.xml）：

cp /usr/local/hadoop/hadoop-2.9.2/etc/hadoop/mapred-site.xml.template /usr/local/hadoop/hadoop-2.9.2/etc/hadoop/mapred-site.xml

vim /usr/local/hadoop/hadoop-2.9.2/etc/hadoop/mapred-site.xml

修改

<configuration>
        <property> 
                <name>mapreduce.framework.name</name> 
                <value>yarn</value>
        </property>
        # 可選則不加
        <property> 
                <name>mapreduce.jobhistory.address</name> 
                <value>hadoop1:10020</value>
        </property> 
        # 可選則不加
        <property> 
                <name>mapreduce.jobhistory.webapp.address</name> 
                <value>hadoop1:19888</value>
        </property> 
</configuration>

mapreduce.framework.name：設置 mapreduce 任務運行在 yarn 上
mapreduce.jobhistory.address：設置 mapreduce 的歷史服務器安裝在BigData01機器上
mapreduce.jobhistory.webapp.address：設置歷史服務器的web頁面地址和端口號

配置yarn-site.xml（YARN上運行的MapReduce框架）：

vim /usr/local/hadoop/hadoop-2.9.2/etc/hadoop/yarn-site.xml

修改

<configuration>
        <property>
             <name>yarn.nodemanager.aux-services</name>
             <value>mapreduce_shuffle</value>
        </property>
        <property>
             <name>yarn.resourcemanager.hostname</name>
             <value>hadoop1</value>
        </property>
        # 可選則不加
        <property>
             <name>yarn.log-aggregation-enable</name>
             <value>true</value>
        </property>
        # 可選則不加
        <property>
             <name>yarn.log-aggregation.retain-seconds</name>
             <value>106800</value>
        </property>
</configuration>

yarn.log-aggregation-enable：是否啓用日誌聚集功能。
yarn.log-aggregation.retain-seconds：設置日誌保留時間，單位是秒

啓動yarn（資源管理系統）：

/usr/local/hadoop/hadoop-2.9.2/sbin/start-yarn.sh

啓動 resourcemanager（控制整個集羣並管理應用程序向基礎計算資源的分配）：

/usr/local/hadoop/hadoop-2.9.2/sbin/yarn-daemon.sh start resourcemanager

啓動 nodemanager（管理 YARN 集羣中的每個節點，監控資源和跟蹤節點）：

/usr/local/hadoop/hadoop-2.9.2/sbin/yarn-daemon.sh start nodemanager

Web頁面查看：

http://本虛擬機IP地址:8088/

運行MapReduce Job：

創建測試文件：

vim /usr/local/hadoop/hadoop-2.9.2/data/tmp/test.input

修改

hadoop mapreduce hive
hbase spark storm
sqoop hadoop hive
spark hadoop

在hdfs創建目錄：

/usr/local/hadoop/hadoop-2.9.2/bin/hdfs dfs -mkdir /demo/input

運行 WordCount MapReduce Job：

/usr/local/hadoop/hadoop-2.9.2/bin/yarn jar /usr/local/hadoop/hadoop-2.9.2/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.9.2.jar wordcount /demo/input /demo/output

查看結果（數據的重複次數）：

hadoop dfs -ls /demo/output

hadoop dfs -cat /demo/output/part-r-00000

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Hadoop集羣配置、啓動YARN

YARN啓動：

配置mapred-site.xml（複製mapred-site.xml.template配置模板生成mapred-site.xml）：

配置yarn-site.xml（YARN上運行的MapReduce框架）：

啓動yarn（資源管理系統）：

啓動 resourcemanager（控制整個集羣並管理應用程序向基礎計算資源的分配）：

啓動 nodemanager（管理 YARN 集羣中的每個節點，監控資源和跟蹤節點）：

Web頁面查看：

運行MapReduce Job：

創建測試文件：

在hdfs創建目錄：

運行 WordCount MapReduce Job：

查看結果（數據的重複次數）：

《Python進階》學習筆記

Leetcode 3161. 物塊放置查詢

一個docker容器暴露多個端口

leetcode 60 排列序列

微服務實踐之使用 Visual Studio 2022 調試Dapr 應用程序

wpf附加屬性理解 WPF附加屬性

Idea史上最全的查看源碼快捷鍵

Mysql索引底層數據結構之B樹

內存溢出解決方式

手把手帶你搭建Zookeeper單機和集羣

Oracle連接遠程數據庫（親測有效）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結