hadoop完全分佈式（雲服務器版）

原創

zzulikang

2020-02-22 15:57

使用的是三臺雲服務器，兩臺騰訊雲，一臺華爲雲，使用的系統爲centos6.8
遇到的坑有點多，所以記錄下來，防止自己忘記，也給大家一個參考

前期準備

hadoop和jdk的tar解壓
jdk和hadoop的環境變量配置
vim /etc/profile

##JAVA_HOME
export JAVA_HOME=/opt/module/jdk1.8.0_144
export PATH=$PATH:$JAVA_HOME/bin
#export JAVA_HOME=/opt/module/jdk-11
#export PATH=$PATH:$JAVA_HOME/bin
##HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-2.7.2
export PATH=$PATH:$HADOOP_HOME/bin
export PATH=$PATH:$HADOOP_HOME/sbin

特別注意的：在/etc/hosts設置本地解析時，本機雲服務器設置爲內網ip，其他爲公網ip

爲了同時更新方便，可使用集羣的腳本文件執行
創建一個xsync的shell文件

#!/bin/bash
#1 獲取輸入參數個數，如果沒有參數，直接退出
pcount=$#
if((pcount==0)); then
echo no args;
exit;
fi

#2 獲取文件名稱
p1=$1
fname=`basename $p1`
echo fname=$fname

#3 獲取上級目錄到絕對路徑
pdir=`cd -P $(dirname $p1); pwd`
echo pdir=$pdir

#4 獲取當前用戶名稱
user=`whoami`

#5 循環
for((host=103; host<105; host++)); do
        echo ------------------- hadoop$host --------------
        rsync -rvl $pdir/$fname $user@hadoop$host:$pdir
done

集羣配置

添加jdk環境的文件

hadoop-env.sh
yarn-env.sh
mapred-env.sh

core-site.xml

<!-- 指定HDFS中NameNode的地址 -->
<property>
		<name>fs.defaultFS</name>
      <value>hdfs://hadoop102:9000</value>
</property>

<!-- 指定Hadoop運行時產生文件的存儲目錄 -->
<property>
		<name>hadoop.tmp.dir</name>
		<value>/opt/module/hadoop-2.7.2/data/tmp</value>
</property>

hdfs-site.xml

<property>
		<name>dfs.replication</name>
		<value>3</value>
</property>

<!-- 指定Hadoop輔助名稱節點主機配置 -->
<property>
      <name>dfs.namenode.secondary.http-address</name>
      <value>hadoop104:50090</value>
</property>

yarn-site.xml

<!-- Reducer獲取數據的方式 -->
<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
</property>

<!-- 指定YARN的ResourceManager的地址 -->
<property>
		<name>yarn.resourcemanager.hostname</name>
		<value>hadoop103</value>
</property>

mapred-site.xml

<!-- 指定MR運行在Yarn上 -->
<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
</property>

格式化namenode

hadoop namenode -format

SSH無密登陸配置

生產公鑰和私鑰

ssh-keygen -t rsa

將公鑰拷貝到需要免密的服務器

ssh-copy-id [服務器ip]

記得設置slaves文件，同步配置

集羣啓動

hdfs啓動 / 關閉
start-dfs.sh / stop-dfs.sh
yarn啓動 / 關閉
start-yarn.sh / stop-yarn.sh

zzulikang

發佈了104 篇原創文章 · 獲贊 4 · 訪問量 7191

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

hadoop完全分佈式（雲服務器版）

前期準備

集羣配置

添加jdk環境的文件

core-site.xml

hdfs-site.xml

yarn-site.xml

mapred-site.xml

格式化namenode

SSH無密登陸配置

記得設置slaves文件，同步配置

集羣啓動

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

關於接口協議，你必須要知道這些！

一鍵自動化博客發佈工具,用過的人都說好(頭條篇)

01 穩定性（一）如何應對事故並做好覆盤？

美團一面：項目中有 10000 個 if else 如何優化？想了半天，被問懵了！

FolkMq v1.4.6 發佈（可以內嵌的消息中間件）

京東面試：如何進行JVM調優？

線程池那些坑爹的參數-核心線程數&最大線程數&工作隊列

Stream流常用方法總結

Spark中RDD轉換算子以及案例

rdd案例：排行的top3計算

selenium中OSError: [WinError 6] 句柄無效。

Scala知識點

Spark中核心組件的基本知識

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結