一、安裝準備
1、下載hadoop,地址:http://hadoop.apache.org/,下載相應版本
2、下載JDK版本:Hadoop只支持1.6以上,地址:http://www.oracle.com/technetwork/java/javase/downloads/index.html
3、操作系統:Linux
4、四臺機器,192.168.1.211(master), 192.168.1.212(slave),192.168.1.213(slave),192.168.1.214(slave)
二、安裝操作
1、在所有機器安裝jdk
2、在所有機器創建Hadoop用戶及用戶組
groupadd -g 55 hadoop
useradd -g 55 hadoop
3、上傳解壓Hadoop包,對Hadoop文件的擁有者改爲hadoop用戶和組
tar -zxvf hadoop-1.0.1.tar.gz
sudo chown -R hadoop:hadoop hadoop-1.0.1
4、配置SSH無密碼登陸
ssh-keygen -t rsa
生成的密鑰對id_rsa,id_rsa.pub,默認存儲在.ssh目錄下
然後將id_rsa.pub的內容複製到每個機器(也包括本機)的.ssh/authorized_keys文件中,
如果機器上已經有authorized_keys這個文件了,就在文件末尾加上id_rsa.pub中的內容,
如果沒有authorized_keys這個文件,直接cp或者scp就好了,
下面的操作假設各個機器上都沒有authorized_keys文件。
scp [email protected]:/home/hadoop/.ssh/authorized_keys ./
5、修改conf/目錄下的master文件,內容如下:
192.168.1.211
6、修改conf/目錄下的slaves文件,內容如下:
192.168.1.212
192.168.1.213
192.168.1.214
7、修改$HADOOP_HOME/conf/hadoop-env.sh文件的環境變量:
# The java implementation to use. Required.
export JAVA_HOME=/usr/java/jdk1.6.0_27
8、修改$HADOOP_HOME/conf/core-site.xml配置文件,內容如下:
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!-- Put site-specific property overrides in this file. -->
<configuration>
<property>
<name>hadoop.tmp.dir</name>
<value>/hadoopdata</value>
<description>A base for other temporary directories.</description>
</property>
<property>
<name>fs.default.name</name>
<value>hdfs://192.168.1.211:9000</value>
<description>The name of the default file system. A URI whose
scheme and authority determine the FileSystem implementation. The
uri's scheme determines the config property (fs.SCHEME.impl) naming
the FileSystem implementation class. The uri's authority is used to
determine the host, port, etc. for a filesystem.</description>
</property>
<property>
<name>dfs.hosts.exclude</name>
<value>excludes</value>
</property>
</configuration>
9、修改$HADOOP_HOME/conf/hdfs-site.xml配置文件,內容如下:
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!-- Put site-specific property overrides in this file. -->
<configuration>
<property>
<name>dfs.replication</name>
<value>1</value>
</property>
</configuration>
10、修改$HADOOP_HOME/conf/mapred-site.xml配置文件,內容如下:
<?xml version="1.0"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<!-- Put site-specific property overrides in this file. -->
<configuration>
<property>
<name>mapred.job.tracker</name>
<value>192.168.1.211:9001</value>
<description>The host and port that the MapReduce job tracker runs
at. If "local", then jobs are run in-process as a single map
and reduce task.
</description>
</property>
</configuration>
11、修改/ect/profile配置文件,在末尾追加以下內容,並輸入source/etc/profile使之生效:
export JAVA_HOME=/usr/java/jdk1.6.0_27
export JRE_HOME=/usr/java/jdk1.6.0_27/jre
export CLASSPATH=.:$JAVA_HOME/lib:$JRE_HOME/lib:$CLASSPATH
export PATH=$JAVA_HOME/bin:$PATH
export HADOOP_HOME=/home/hadoop/hadoop-1.0.1
export PATH=$HADOOP_HOME/bin:$PATH
export PATH=$PATH:$HIVE_HOME/bin
12、將主控機器上Hadoop分別給節點機器複製一份。
將/ect/profile拷貝到132、133和134機器上。注意profile需要做生效操作。
三、啓動/停止hadoop
1、通過shell腳本啓動hadoop,可以通過jps命令查看是否啓動NameNode、DataNode、secondaryNameNode、JobTracker、TaskTracher
注意:先要進行格式化HDFS文件系統,才能啓動NameNode
$HADOOP_HOME/bin/start-all.sh
2、停止hadoop
$HADOOP_HOME/bin/stop-all.sh
四、初始配置
1、格式化HDFS文件系統。進入$HADOOP_HOME/bin目錄。執行:hadoop namenode –format
2、在$HADOOP_HOME/bin目錄下,執行:hadoop fs -ls /
如果控制檯返回結果,表示初始化成功。可以向裏面錄入數據。
3、通過WEB查看hadoop
查看集羣狀態 http://192.168.1.211:50070/dfshealth.jsp
查看JOB狀態 http://192.168.1.211:50030/jobtracker.jsp
Hadoop分佈式安裝
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
hadoop一步步入門
lcyuanjiang
2019-02-23 13:59:15
hadoop搭建之hive安裝
伊人心
2019-02-23 00:41:25
(第3篇)HDFS是什麼?HDFS適合做什麼?我們應該怎樣操作HDFS系統?
I加加
2019-02-23 00:38:18
(第2篇)一篇文章教你輕鬆安裝hadoop
I加加
2019-02-23 00:37:53
(第6.1篇)大數據發展背後的強力推手——HBase分佈式存儲系統
I加加
2019-02-23 00:37:53
(第8篇)實時可靠的開源分佈式實時計算系統——Storm
I加加
2019-02-23 00:37:53
(第7篇)靈活易用易維護的hadoop數據倉庫工具——Hive
I加加
2019-02-23 00:37:51
(第4篇)hadoop之魂--mapreduce計算框架,讓收集的數據產生價值
I加加
2019-02-23 00:37:51
(第1篇)什麼是hadoop大數據?我又爲什麼要寫這篇文章?
I加加
2019-02-23 00:37:51
(第9篇)大數據的的超級應用——數據挖掘-推薦系統
I加加
2019-02-23 00:37:50
(第5篇)避免協作衝突--簡單易接入的Zookeeper
I加加
2019-02-23 00:37:50
hadoop 完全分佈式搭建(帶配置文件)
wangyudiwang
2019-02-23 00:37:11
hbase安裝
chengongliang
2019-02-23 00:28:08
hadoop安裝
chengongliang
2019-02-23 00:28:08
基於spark排序的一種更廉價的實現方案-附基於spark的性能測試
wx58a7bb5e188a6
2019-02-23 00:26:45