一、本地運行模式
參考:http://dblab.xmu.edu.cn/blog/install-hadoop/
二、僞分佈運行模式
參考:http://dblab.xmu.edu.cn/blog/install-hadoop/
三、完全分佈式運行模式
-
準備3臺客戶機(關閉防火牆、設置靜態
IP
、設置主機名稱) -
安裝
JDK
並配置環境變量 -
安裝
Hadoop
並配置環境變量 -
配置集羣文件
- 核心配置文件
core-site.xml
<!-- 指定HDFS中NameNode的地址 --> <property> <name>fs.defaultFS</name> <value>hdfs://hadoop102:9000</value> </property> <!-- 指定Hadoop運行時產生文件的存儲目錄 --> <property> <name>hadoop.tmp.dir</name> <value>/opt/module/hadoop-2.7.2/data/tmp</value> </property>
- 配置
hdfs-site.xml
,寫入JAVA_HOME
路徑 - 配置
hdfs-site.xml
<property> <name>dfs.replication</name> <value>3</value> </property> <!-- 指定Hadoop輔助名稱節點主機配置 --> <property> <name>dfs.namenode.secondary.http-address</name> <value>hadoop104:50090</value> </property>
- 配置
yarn-env.sh
,寫入JAVA_HOME
路徑 - 配置
yarn-site.xml
<!-- Reducer獲取數據的方式 --> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce_shuffle</value> </property> <!-- 指定YARN的ResourceManager的地址 --> <property> <name>yarn.resourcemanager.hostname</name> <value>hadoop103</value> </property>
- 配置
mapred-env.sh
,寫入JAVA_HOME
路徑 - 配置
mapred-sit.xml
<!-- 指定MR運行在Yarn上 --> <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property>
- 核心配置文件
-
設置單點啓動
- 集羣第一次啓動需要格式化
NameNode
hadoop namenode -format
- 集羣第一次啓動需要格式化
-
配置
ssh
-
羣起並測試集羣