Hadoop伪分布式安装体验

原創

wcj0626

2020-06-28 02:19

这段时间有空想研究MapReduce，于是选择安装Hadoop。只有一台机器，就选择了伪分布式安装。

1、从官网下载Hadoop2.2

2、把安装包解压到当前用户名的主目录下。（也可以把Hadoop解压放置到其他地方，但是请确保该文件夹的所有者是执行hadoop操作的用户）

3、设置ssh的无密码访问，详情请移步这里

4、安装JAVA环境，详情请移步这里

5、对Hadoop的设置：

下面四个文件在hadoop/etc/hadoop文件夹下：

5.1 设置core-site.xml

添加如下内容：

<configuration>
<property>
<name>fs.default.name</name>
<value>hdfs://localhost:9000</value>
</property>
</configuration>

5.2设置mapred-site.xml

安装包里没有该文件，只有mapred-site.xml.template，拷贝一份为mapred-site.xml即可，在mapred-site.xml中添加如下内容：

<configuration>
<property>
<name>mapred.job.tracker</name>
<value>localhost:9001</value>
</property>
</configuration>

5.2 设置hdfs-site.xml

添加如下内容：

<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>

5.3 设置hadoop-env.sh
如果在安装java时没设置JAVA_HOME，那在hadoop-env.sh文件添加如下内容：

# The java implementation to use.
export JAVA_HOME=${JAVA_HOME}
export JAVA_HOME=/opt/jdk1.7.0_45

在core-site.xml和mapred-site.xml中分别指定了NameNode和JobTracker的主机名与端口。在hdfs-site.xml只能指定了HDFS的默认副本数，因为仅仅运行在一个节点上，这里副本为1.

如果把上述5步都设置完了，安装伪分布式安装基本完成。执行以下操作看效果：

1. hadoop@node1:~/hadoop$ bin/hadoop namenode -format

正常输出如下：

......(一大堆省略)

/************************************************************
SHUTDOWN_MSG: Shutting down NameNode at node1/127.0.1.1
************************************************************/

2. hadoop@node1:~/hadoop$ sbin/start-all.sh

输出如下：

hadoop@node1:~/hadoop$ sbin/start-all.sh 
This script is Deprecated. Instead use start-dfs.sh and start-yarn.sh
Starting namenodes on [localhost]
localhost: starting namenode, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-namenode-node1.out
localhost: starting datanode, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-datanode-node1.out
Starting secondary namenodes [0.0.0.0]
0.0.0.0: starting secondarynamenode, logging to /home/hadoop/hadoop/logs/hadoop-hadoop-secondarynamenode-node1.out
starting yarn daemons
starting resourcemanager, logging to /home/hadoop/hadoop/logs/yarn-hadoop-resourcemanager-node1.out
localhost: starting nodemanager, logging to /home/hadoop/hadoop/logs/yarn-hadoop-nodemanager-node1.out

3. hadoop@node1:~/hadoop$ jps

输出如下：

hadoop@node1:~/hadoop$ jps 
2035 NameNode
2933 Jps
2248 DataNode
2888 NodeManager
2664 ResourceManager
2513 SecondaryNameNode
hadoop@node1:~/hadoop$

可以看到，jps命令列出素有守护进程。安装成功。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

Hadoop伪分布式安装体验

Hadoop僞分佈式安裝體驗

高通平臺下安卓opencl小例子

RenderScript控制並行化線程數量

安卓下PowerVR OpenCL編程

OpenACC與cublas交互-fortran版本

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結