hadoop　ha的集羣搭建

原創

2020-02-20 14:21

1.修改Linux主機名

2.修改IP

3.修改主機名和IP的映射關係 /etc/hosts

---------注意---------

如果你們公司是租用的服務器或是使用的雲主機（如華爲用主機、阿里雲主機等）

/etc/hosts裏面要配置的是內網IP地址和主機名的映射關係

4.關閉防火牆

5.ssh免登陸

6.安裝JDK，配置環境變量等

集羣部署節點角色的規劃（7節點）

------------------

server01 namenode zkfc

server02 namenode zkfc

server03 resourcemanager

server04 resourcemanager

server05 datanode nodemanager zookeeper journal node

server06 datanode nodemanager zookeeper journal node

server07 datanode nodemanager zookeeper journal node

------------------

集羣部署節點角色的規劃（3節點）

------------------

server01 namenode resourcemanager zkfc nodemanager datanode zookeeper journal node

server02 namenode resourcemanager zkfc nodemanager datanode zookeeper journal node

server03 datanode nodemanager zookeeper journal node

------------------

安裝步驟：

2.安裝配置hadoop集羣

2.1解壓

tar -zxvf hadoop-2.6.4.tar.gz -C /home/hadoop/app/

2.2配置HDFS（hadoop2.0所有的配置文件都在$HADOOP_HOME/etc/hadoop目錄下）

#將hadoop添加到環境變量中

vim /etc/profile

export JAVA_HOME=/usr/java/jdk1.7.0_55

export HADOOP_HOME=/hadoop/hadoop-2.6.4

export PATH=$PATH:$JAVA_HOME/cluster1n:$HADOOP_HOME/cluster1n

#hadoop2.0的配置文件全部在$HADOOP_HOME/etc/hadoop下

cd /home/hadoop/app/hadoop-2.6.4/etc/hadoop

2.2.1修改hadoop-env.sh

export JAVA_HOME=/home/hadoop/app/jdk1.7.0_55

###############################################################################

2.2.2修改core-site.xml

<configuration>

<property>

<name>fs.defaultFS</name>

<value>hdfs://cluster1</value>

</property>

<property>

<name>hadoop.tmp.dir</name>

<value>/root/apps/hadoop/tmp</value>

</property>

<property>

<name>ha.zookeeper.quorum</name>

<value>hadoop05:2181,hadoop06:2181,hadoop07:2181</value>

</property>

</configuration>

###############################################################################

2.2.3修改hdfs-site.xml

<configuration>

<property>

<name>dfs.nameservices</name>

<value>cluster1</value>

</property>

<property>

<name>dfs.ha.namenodes.cluster1</name>

<value>nn1,nn2</value>

</property>

<property>

<name>dfs.namenode.rpc-address.cluster1.nn1</name>

<value>mini1:9000</value>

</property>

<property>

<name>dfs.namenode.http-address.cluster1.nn1</name>

<value>hadoop00:50070</value>

</property>

<property>

<name>dfs.namenode.rpc-address.cluster1.nn2</name>

<value>hadoop01:9000</value>

</property>

<property>

<name>dfs.namenode.http-address.cluster1.nn2</name>

<value>hadoop01:50070</value>

</property>

<property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://hadoop05:8485;hadoop06:8485;hadoop07:8485/cluster1</value>

</property>

<property>

<name>dfs.journalnode.edits.dir</name>

<value>/home/hadoop/app/hdpdata/journaldata</value>

</property>

<property>

<name>dfs.ha.automatic-failover.enabled</name>

<value>true</value>

</property>

<property>

<name>dfs.client.failover.proxy.provider.cluster1</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<property>

<name>dfs.ha.fencing.methods</name>

<value>

sshfence

</value>

</property>

<property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

<value>/home/hadoop/.ssh/id_rsa</value>

</property>

<property>

<name>dfs.ha.fencing.ssh.connect-timeout</name>

<value>30000</value>

</property>

</configuration>

###############################################################################

2.2.4修改mapred-site.xml

<configuration>

<property>

<name>mapreduce.framework.name</name>

<value>yarn</value>

</property>

</configuration>

###############################################################################

2.2.5修改yarn-site.xml

<configuration>

<property>

<name>yarn.resourcemanager.ha.enabled</name>

<value>true</value>

</property>

<property>

<name>yarn.resourcemanager.cluster-id</name>

<value>yrc</value>

</property>

<property>

<name>yarn.resourcemanager.ha.rm-ids</name>

<value>rm1,rm2</value>

</property>

<property>

<name>yarn.resourcemanager.hostname.rm1</name>

<value>hadoop03</value>

</property>

<property>

<name>yarn.resourcemanager.hostname.rm2</name>

<value>hadoop04</value>

</property>

<property>

<name>yarn.resourcemanager.zk-address</name>

<value>hadoop05:2181,hadoop06:2181,hadoop07:2181</value>

</property>

<property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

2.2.6修改slaves(slaves是指定子節點的位置，因爲要在hadoop01上啓動HDFS、在hadoop03啓動yarn，所以hadoop01上的slaves文件指定的是datanode的位置，hadoop03上的slaves文件指定的是nodemanager的位置)

hadoop05

hadoop06

hadoop07

2.2.7配置免密碼登陸

#首先要配置hadoop00到hadoop01、hadoop02、hadoop03、hadoop04、hadoop05、hadoop06、hadoop07的免密碼登陸

#在hadoop01上生產一對鑰匙

ssh-keygen -t rsa

#將公鑰拷貝到其他節點，包括自己

ssh-coyp-id hadoop00

ssh-coyp-id hadoop01

ssh-coyp-id hadoop02

ssh-coyp-id hadoop03

#配置hadoop02到hadoop04、hadoop05、hadoop06、hadoop07的免密碼登陸

#在hadoop02上生產一對鑰匙

ssh-keygen -t rsa

#將公鑰拷貝到其他節點

ssh-coyp-id hadoop03

ssh-coyp-id hadoop04

#注意：兩個namenode之間要配置ssh免密碼登陸，別忘了配置hadoop01到hadoop00的免登陸

在hadoop01上生產一對鑰匙

ssh-keygen -t rsa

ssh-coyp-id -i hadoop00

2.4將配置好的hadoop拷貝到其他節點

scp -r /hadoop/ hadoop02:/

scp -r /hadoop/ hadoop03:/

scp -r /hadoop/hadoop-2.6.4/ hadoop@hadoop04:/hadoop/

scp -r /hadoop/hadoop-2.6.4/ hadoop@hadoop05:/hadoop/

scp -r /hadoop/hadoop-2.6.4/ hadoop@hadoop06:/hadoop/

scp -r /hadoop/hadoop-2.6.4/ hadoop@hadoop07:/hadoop/

###注意：嚴格按照下面的步驟!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!

2.5啓動zookeeper集羣（分別在hadoop05、hadoop06、tcast07上啓動zk）

cd /hadoop/zookeeper-3.4.5/cluster1n/

./zkServer.sh start

#查看狀態：一個leader，兩個follower

./zkServer.sh status

2.6手動啓動journalnode（分別在在hadoop05、hadoop06、hadoop07上執行）

cd /hadoop/hadoop-2.6.4

scluster1n/hadoop-daemon.sh start journalnode

#運行jps命令檢驗，hadoop05、hadoop06、hadoop07上多了JournalNode進程

2.7格式化namenode

#在hadoop00上執行命令:

hdfs namenode -format

#格式化後會在根據core-site.xml中的hadoop.tmp.dir配置生成個文件，這裏我配置的是/hadoop/hadoop-2.6.4/tmp，然後將/hadoop/hadoop-2.6.4/tmp拷貝到hadoop02的/hadoop/hadoop-2.6.4/下。

scp -r tmp/ hadoop02:/home/hadoop/app/hadoop-2.6.4/

##也可以這樣，建議hdfs namenode -bootstrapStandby

2.8格式化ZKFC(在hadoop00上執行即可)

hdfs zkfc -formatZK

2.9啓動HDFS(在hadoop00上執行)

scluster1n/start-dfs.sh

2.10啓動YARN(#####注意#####：是在hadoop02上執行start-yarn.sh，把namenode和resourcemanager分開是因爲性能問題，因爲他們都要佔用大量資源，所以把他們分開了，他們分開了就要分別在不同的機器上啓動)

scluster1n/start-yarn.sh

到此，hadoop-2.6.4配置完畢，可以統計瀏覽器訪問:

http://hadoop00:50070

NameNode 'hadoop01:9000' (active)

http://hadoop01:50070

NameNode 'hadoop02:9000' (standby)

驗證HDFS HA

首先向hdfs上傳一個文件

hadoop fs -put /etc/profile /profile

hadoop fs -ls /

然後再kill掉active的NameNode

kill -9 <pid of NN>

通過瀏覽器訪問：http://192.168.1.202:50070

NameNode 'hadoop02:9000' (active)

這個時候hadoop02上的NameNode變成了active

在執行命令：

hadoop fs -ls /

-rw-r--r-- 3 root supergroup 1926 2014-02-06 15:36 /profile

剛纔上傳的文件依然存在！！！

手動啓動那個掛掉的NameNode

scluster1n/hadoop-daemon.sh start namenode

通過瀏覽器訪問：http://192.168.1.201:50070

NameNode 'hadoop01:9000' (standby)

驗證YARN：

運行一下hadoop提供的demo中的WordCount程序：

hadoop jar share/hadoop/mapreduce/hadoop-mapreduce-examples-2.4.1.jar wordcount /profile /out

OK，大功告成！！！

測試集羣工作狀態的一些指令：

cluster1n/hdfs dfsadmin -report 查看hdfs的各節點狀態信息

cluster1n/hdfs haadmin -getServiceState nn1 獲取一個namenode節點的HA狀態

scluster1n/hadoop-daemon.sh start namenode 單獨啓動一個namenode進程

./hadoop-daemon.sh start zkfc 單獨啓動一個zkfc進程

發佈了33 篇原創文章 · 獲贊 13 · 訪問量 2萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

網易面試：SpringBoot如何開啓虛擬線程？

虛擬線程（Virtual Thread）也稱協程或纖程，是一種輕量級的線程實現，與傳統的線程以及操作系統級別的線程（也稱爲平臺線程）相比，它的創建開銷更小、資源利用率更高，是 Java 併發編程領域的一項重要創新。 PS：虛擬線程正式發佈

Java中文社羣

2024-06-12 14:42:21

聊聊GLM-4-9B開源模型的微調loss計算

概述 Github官方地址：GLM-4 網上已經有很多關於微調的文章，介紹各種方式下的使用，這裏不會贅述。我個人比較關心的是微調時的loss計算邏輯，這點在很多的文章都不會有相關的描述，因爲大多數人都是關心如何使用之類的應用層，而不是其具體

2024-06-12 14:42:01

在.NET Core，除了VB的LikeString，還有其它方法嗎？(四種LikeString實現分享)

Like運算符很好用，特別是它所提供的其中*、?這兩種通配符，在Windows文件系統和各類項目中運用非常廣泛。但Like運算符僅在VB中支持，在C#中，如何實現呢？以下是關於LikeString的四種實現方式，其中第四種爲Regex正

2024-06-12 14:40:00

解讀surging 的內存過高的原因

前言對於.NET開發人員來講，一個程序佔用內存過高，是極其糟糕，是一款不合格的程序軟件，.NET開發人員也不會去使用服務器垃圾收集器(ServerGarbageCollection),而是選用工作站垃圾收集器，而是對於一款低

2024-06-12 14:38:40

【接口自動化測試框架練習】springboot+react+mysql～極簡版postman

可以說是一個toy program，chatgpt完成了一部分工作，我也完成了一部分工作，我倆合作的，我佔百分之80%，他百分之20%，哈哈沒他不行，源碼奉上。https://github.com/Jinwenxin/test-api-fr

金大鑫要堅持

2024-06-12 14:36:30

sm4加密工具類

using Org.BouncyCastle.Utilities.Encoders; using System; using System.Collections.Generic; using System.Linq; using Syst

2024-06-12 14:34:40

下載遊戲的好網站

https://www.gbtgames.com/thread-1198.htm 都是安裝包, 扔迅雷裏面就行. 都很乾淨沒廣告.

張博的博客

2024-06-12 14:29:19

記一次 .NET某遊戲幣自助機後端內存暴漲分析

一：背景 1. 講故事前些天有位朋友找到我，說他們的程序內存會偶發性暴漲，自己分析了下是非託管內存問題，讓我幫忙看下怎麼回事？哈哈，看到這個dump我還是非常有興趣的，居然還有這種遊戲幣自助機類型的程序，下次去大玩家看看他們出幣的機器後端

2024-06-12 14:25:09

CSS 遮罩層

html <!DOCTYPE html> <html> <head> <link rel="stylesheet" href="basic.css"> </head> <body> <div class="masked-element">

2024-06-12 14:24:39

sc-token傳參方式

2024-06-12 14:24:29

Excel甘特

1、數據 2、全選日期(從8到22的所有日期) 3、爲全選日期新增規則規則1(當前日期>=開始日期，當前日期<=結束日期) 公式裏面$符號去掉格式如下格式化如下點確定如下規則2(超過當前日期)

2024-06-12 14:24:29

限速上傳文件到騰訊對象存儲cos的腳本

官網：https://cloud.tencent.com/document/product/436/12269 安裝包，這裏用的python2.7 # pip install -U cos-python-sdk-v5 -i http

2024-06-12 14:23:19

Mysql無主鍵刪除重複數據的快速方法

create procedure p() begin create table casbin_rule_copy2 select distinct * from casbin_rule; drop table casbi

2024-06-12 14:22:49

HDU 1255（掃描線、線段樹區間修改）

Problem - 1255 (hdu.edu.cn) 題意在二維平面座標軸上輸入n個矩形，問被這n個矩形覆蓋了兩次或兩次以上的區域的面積總和。給的題意有點問題，實際輸入是矩形的左下和右上，另外樣例1應該輸出7.62. 思路掃描線，這

2024-06-12 14:19:49

Python 調整PDF頁面尺寸大小

在處理PDF文件時，我們可能會遇到這樣的情況：原始PDF文檔不符合我們的閱讀習慣，或者需要適配不同顯示設備等。這時，我們就需要及時調整PDF文檔中的頁面尺寸，以滿足不同應用場景的需求。利用Python語言的高效性和靈活性，再結合Spire

2024-06-12 14:19:38

24小時熱門文章

最新文章

最新評論文章