簡短使用的HADOOP2版本的安裝配置

hadoop2.0已經發布了穩定版本了，增加了很多特性，比如HDFS HA、YARN等。

注意：apache提供的hadoop-2.2.0的安裝包是在32位操作系統編譯的，因爲hadoop依賴一些C++的本地庫，

所以如果在64位的操作上安裝hadoop-2.2.0就需要重新在64操作系統上重新編譯

前期準備就不詳細說了,前邊的都有

1.修改Linux主機名

2.修改IP

3.修改主機名和IP的映射關係

4.關閉防火牆

5.ssh免登陸

6.安裝JDK，配置環境變量等

集羣規劃：

主機名 IP 安裝的軟件運行的進程

hadoop01 192.168.1.201 hadoop、zookkeeper NameNode、DataNode、QuorumPeerMain、JournalNode、DFSZKFailoverController、ResourceManager、NodeManager

hadoop02 192.168.1.202 hadoop、zookkeeper NameNode、DataNode、QuorumPeerMain、JournalNode、DFSZKFailoverController、NodeManager

hadoop03 192.168.1.203 hadoop、zookkeeper DataNode、QuorumPeerMain、JournalNode、NodeManager

說明：

在hadoop2.0中通常由兩個NameNode組成，一個處於active狀態，另一個處於standby狀態。Active NameNode對外提供服務，而Standby NameNode則不對外提供服務，僅同步active namenode的狀態，以便能夠在它失敗時快速進行切換。

hadoop2.0官方提供了兩種HDFS HA的解決方案，一種是NFS，另一種是QJM。這裏我們使用簡單的QJM。在該方案中，主備NameNode之間通過一組JournalNode同步元數據信息，一條數據只要成功寫入多數JournalNode即認爲寫入成功。通常配置奇數個JournalNode

這裏還配置了一個zookeeper集羣，用於ZKFC（DFSZKFailoverController）故障轉移，當Active NameNode掛掉了，會自動切換Standby NameNode爲standby狀態

安裝步驟：

1.安裝配置zooekeeper集羣

1.1解壓

tar -zxvfzookeeper-3.4.5.tar.gz -C /itcast/

1.2修改配置

cd/itcast/zookeeper-3.4.5/conf/

cp zoo_sample.cfgzoo.cfg

vim zoo.cfg

修改：dataDir=/itcast/zookeeper-3.4.5/tmp

在最後添加：

server.1=hadoop01:2888:3888

server.2=hadoop02:2888:3888

server.3=hadoop03:2888:3888

保存退出

然後創建一個tmp文件夾

mkdir/itcast/zookeeper-3.4.5/tmp

再創建一個空文件

touch/itcast/zookeeper-3.4.5/tmp/myid

最後向該文件寫入ID

echo 1 >/itcast/zookeeper-3.4.5/tmp/myid

1.3將配置好的zookeeper拷貝到其他節點(首先分別在hadoop02、hadoop03根目錄下創建一個itcast目錄：mkdir /itcast)

scp -r/itcast/zookeeper-3.4.5/ hadoop02:/itcast/

scp -r/itcast/zookeeper-3.4.5/ hadoop03:/itcast/

注意：修改hadoop02、hadoop03對應/itcast/zookeeper-3.4.5/tmp/myid內容

hadoop02：

echo 2 >/itcast/zookeeper-3.4.5/tmp/myid

hadoop02：

echo 3 >/itcast/zookeeper-3.4.5/tmp/myid

2.安裝配置hadoop集羣

2.1解壓

tar -zxvfhadoop-2.2.0.tar.gz -C /itcast/

2.2配置HDFS（hadoop2.0所有的配置文件都在$HADOOP_HOME/etc/hadoop目錄下）

將hadoop添加到環境變量中

vim /etc/profile

exportJAVA_HOME=/usr/java/jdk1.6.0_45

exportHADOOP_HOME=/itcast/hadoop-2.2.0

exportPATH=$PATH:$JAVA_HOME/bin:$HADOOP_HOME/bin

cd/itcast/hadoop-2.2.0/etc/hadoop

2.2.1修改hadoo-env.sh

exportJAVA_HOME=/usr/java/jdk1.6.0_45

2.2.2修改core-site.xml

<name>fs.defaultFS</name>

</property>

<name>hadoop.tmp.dir</name>

<value>/itcast/hadoop-2.2.0/tmp</value>

</property>

<name>ha.zookeeper.quorum</name>

<value>hadoop01:2181,hadoop02:2181,hadoop03:2181</value>

</property>

</configuration>

2.2.3修改hdfs-site.xml

<name>dfs.nameservices</name>

</property>

<name>dfs.ha.namenodes.ns1</name>

</property>

<name>dfs.namenode.rpc-address.ns1.nn1</name>

<value>hadoop01:9000</value>

</property>

<name>dfs.namenode.http-address.ns1.nn1</name>

<value>hadoop01:50070</value>

</property>

<name>dfs.namenode.rpc-address.ns1.nn2</name>

<value>hadoop02:9000</value>

</property>

<name>dfs.namenode.http-address.ns1.nn2</name>

<value>hadoop02:50070</value>

</property>

<name>dfs.namenode.shared.edits.dir</name>

<value>qjournal://hadoop01:8485;hadoop02:8485;hadoop03:8485/ns1</value>

</property>

<name>dfs.journalnode.edits.dir</name>

<value>/itcast/hadoop-2.2.0/journal</value>

</property>

<name>dfs.ha.automatic-failover.enabled</name>

</property>

<name>dfs.client.failover.proxy.provider.ns1</name>

<value>org.apache.hadoop.hdfs.server.namenode.ha.ConfiguredFailoverProxyProvider</value>

</property>

<name>dfs.ha.fencing.methods</name>

<value>sshfence</value>

</property>

<name>dfs.ha.fencing.ssh.private-key-files</name>

</property>

</configuration>

2.2.4修改slaves

hadoop01

hadoop02

hadoop03

2.3配置YARN

2.3.1修改yarn-site.xml

<name>yarn.resourcemanager.hostname</name>

<value>hadoop01</value>

</property>

<name>yarn.nodemanager.aux-services</name>

<value>mapreduce_shuffle</value>

</property>

</configuration>

2.3.2修改mapred-site.xml

<name>mapreduce.framework.name</name>

</property>

</configuration>

2.4將配置好的hadoop拷貝到其他節點

scp -r/itcast/hadoop-2.2.0/ hadoo02:/itcast/

scp -r /itcast/hadoop-2.2.0/hadoo03:/itcast/

2.5啓動zookeeper集羣（分別在hadoop01、hadoop02、hadoop03上啓動zk）

cd/itcast/zookeeper-3.4.5/bin/

./zkServer.sh start

查看狀態：

./zkServer.sh status

（一個leader，兩個follower）

2.6啓動journalnode（在hadoop01上啓動所有journalnode）

cd /itcast/hadoop-2.2.0

sbin/hadoop-daemons.shstart journalnode

(運行jps命令檢驗，多了JournalNode進程)

2.7格式化HDFS

在hadoop01上執行命令:

hadoop namenode-format

格式化後會在根據core-site.xml中的hadoop.tmp.dir配置生成個文件，這裏我配置的是/itcast/hadoop-2.2.0/tmp，然後將/itcast/hadoop-2.2.0/tmp拷貝到hadoop02的/itcast/hadoop-2.2.0/下。

scp -r tmp/hadoop02:/itcast/hadoop-2.2.0/

2.8格式化ZK(在hadoop01上執行即可)

hdfs zkfc -formatZK

2.9啓動HDFS(在hadoop01上執行)

sbin/start-dfs.sh

2.10啓動YARN(在hadoop01上執行)

sbin/start-yarn.sh

到此，hadoop2.2.0配置完畢，可以統計瀏覽器訪問:

http://192.168.1.201:50070

NameNode 'hadoop01:9000' (active)

http://192.168.1.202:50070

NameNode 'hadoop02:9000' (standby)

驗證HDFS HA

首先向hdfs上傳一個文件

hadoop fs -put /etc/profile /profile

hadoop fs -ls /

然後再kill掉active的NameNode

kill -9 <pid of NN>

通過瀏覽器訪問：http://192.168.1.202:50070

NameNode 'hadoop02:9000' (active)

這個時候hadoop02上的NameNode變成了active

在執行命令：

hadoop fs -ls /

-rw-r--r-- 3 root supergroup 1926 2014-02-06 15:36 /profile

剛纔上傳的文件依然存在！！！

手動啓動那個掛掉的NameNode

sbin/hadoop-daemon.sh start namenode

通過瀏覽器訪問：http://192.168.1.201:50070

NameNode 'hadoop01:9000' (standby)

驗證YARN：

運行一下hadoop提供的demo中的WordCount程序：

hadoop jarshare/hadoop/mapreduce/hadoop-mapreduce-examples-2.2.0.jar wordcount /profile/out

OK，大功告成！！！

參見：http://blog.163.com/frank_gwf/blog/static/23020501220141274320724/

簡短使用的HADOOP2版本的安裝配置

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

企業大模型如何成爲自己數據的“百科全書”？

本地SSL證書過期輸入命令在IIS自動生成

基於Ubuntu-22.04安裝K8s-v1.28.2實驗（二）使用kube-vip實現集羣VIP訪問

.NET週刊【5月第2期 2024-05-12】

簡短使用的HADOOP2版本的安裝配置

Java面試題：靜態塊、塊、構造函數的初始化順序

官方譯文【hadoop yarn 運行原理剖析】

hadoop中mapreduce的常用類

hive與mysql的整合

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結