Hadoop伪分布集群部署
本手册安装环境如下:
Linux:Centos6.8
JDK:jdk-8u191-linux-x64.tar.gz
Hadoop:hadoop-2.7.7.tar.gz
这三个环境直接去下载,或者用我已经下载好的
链接:https://pan.baidu.com/s/1aweIgiIDd4pigRBUxpdI1A
提取码:zqyw
配置过程中要注意分清:root用户 与 普通用户fuhadoop
各类安装包已提前放在/home/fuhadoop/bigdata/下.
伪分布安装
前期准备
1.1.1关闭防火墙
1、
切换到root用户下,在终端输入setup命令:
会出现下面图中内容
选择“Firewall configuration”选项,回车进入选项
如果该项前面有“*”标,则按一下空格键关闭防火墙,如下图所示,然后光标移动选择“OK”保存修改内容
1.1.2安装JDK
root用户下,将JDK文件解压到/usr/java目录下,没有java文件夹自己创建
su
cd ~/bigdata
mkdir /usr/java
cp jdk-8u191-linux-x64.tar.gz/usr/java
cd /usr/java
tar -xvf jdk-8u191-linux-x64.tar.gz
mv jdk1.8.0_191/ jdk1.8
通用户 fuhadoop ,使用vi配置环境变量
复制粘贴以下内容添加到到上面 vi打开的文件中:
export JAVA_HOME=/usr/java/jdk1.8/ #jdk1.8是解压出来的目录
export PATH=PATH
变成这样:
按esc键 再按 :wq 保存退出
使改动生效:
测试配置:
出现这样就完成JDK的安装
1.2 Hadoop配置
下面所有的操作都使用普通用户fuhaoop切换普通 用户的命令是
1.2.1 Hadoop安装包解压
解压hadoop安装包到目录:~/bigdata/
1.2.2 Hadoop文件配置
Hadoop 的配置文件位于 $HADOOP_HOME/etc/hadoop/ 中,修改4个配置文件
core-site.xml ,
hdfs-site.xml, mapred-site.xml和yarn-site.xml
core-site.xml配置如下
找到core-site.xml 文件的位置,右击编辑(Open with gedit),如图
他三个一样
hdfs-site.xml配置如下:
mapred-site.xml配置如下
yarn-site.xml配置如下:
hadoop-env.sh配置如下
环境变量文件中,只需要配置 JDK 的路径。
vi
~/bigdata/hadoop-2.7.7/etc/hadoop/hadoop-env.sh
在文件的靠前的部分找到下面的一行代码:
export
JAVA_HOME=${JAVA_HOME}
将这行代码修改为下面的代码:
export
JAVA_HOME=/usr/java/jdk1.8
然后保存文件。
2.3 配置环境变量
使用vi配置环境变量
vi ~/.bash_profile
复制粘贴以下内容添加到到上面
vi打开的文件中:
export
HADOOP_HOME=/home/fuhadoop/bigdata/hadoop-2.7.7
export
HADOOP_CONF_DIR=HADOOP_HOME/etc/hadoop
export
YARN_CONF_DIR=PATH:HADOOP_HOME/bin:$HADOOP_HOME/sbin
如图:
使改动生效:
source ~/.bash_profile
2.4 NameNode格式化
hadoop
namenode -format
注:若有需要再次格式化,请将$HADOOP_HOME/logs文件夹里面内容清空。以及hadoopdata文件夹里面的内容清空。
2.5 计算pi值
先启动Hadoop集群
start-all.sh
查看配置是否正确:
如果没有图示六条数据,回去检查一下配置路径有没有错。
开始访问网页端:
1、localhost:50070
2、localhost:18088
3、使用hadoop-mapreduce-examples-2.7.7.jar计算圆周率(下面是一行代码)
hadoop
jar ~/bigdata/hadoop-2.7.7/share/hadoop/mapreduce/hadoop-mapreduce-examples-2.7.7.jar
pi 10 10
结果如图:
4、尝试使用put命令提交本地文件,通过cat命令查看该文件
结果如图:
使用完请关闭集群
stop-all.sh
伪分布安装完成