hadoop和hbase整合

原創

ruanjianzhilu

2019-02-23 00:10

2 測試環境

Eclipse-version : Juno Service Release 1,hadoop-version hadoop-1.0.4,hbase -version hbase-0.92.0, jdk-version: 1.6.0_31

3 ssh-server安裝

1 在ubuntu 12.04的版本中已經安裝了ssh-client，這裏還需要進行ssh-server的安裝。安裝如下圖:

圖-ssh-server安裝

2 使用主節點上的ssh-keygen生成rsa密鑰對，務必避免輸入密碼，否則每次節點啓動的時候都會提示輸入密碼。生成方式如下(一路回車即可):

圖-keygen生成

3 對生成的密鑰進行授權:

圖-授權

注:在生成密鑰對時需要注意用戶,如果是普通用戶則在生成keygen的時候不需要加sudo ex:ssh-keygen -t rsa -P “”。如果爲管理員賬戶則需要加入sudo來執行 ex: sudo ssh-keygen -t rsa -P “”

4 hadoop相關配置（前提條件是要安裝ssh-server，jdk）

1. 將下載的hadoop壓縮文件進行解壓，我解壓的目錄是在 “下載” 目錄。

2. 對解壓的hadoop進行配置，打開conf/目錄。編輯hadoop-env.sh文件

對裏面的java_home進行設置。

圖- java_home設置

3.對core_site.xml文件進行配置，以下分別對主機節點的地址和存儲文件的路徑進行配置，文件路徑默認情況是存在/tmp/目錄下的。

圖- core-site.xml配置

4. 對mapred-site.xml進行配置，以下是對job的主機端口的配置

圖 - mapred-site.xml設置

5.在啓動主機之前學要對hdfs系統進行格式化。Bin/hadoop namenode -format 格式化之後會在你配置文件給定的目錄中生成一個hdfs的工作目錄。

圖-hdfs工作目錄生成

6.啓動hdfs。這裏的datanode jobtracker都在同一主機上運行。啓動時需要注意不是直接運行bin/start-all.sh文件。而是按以下順序來運行。引文在單個注意上運行時datanode namenode jobtracker tasktracker 等都是在同一主機上運行。但是在運行時候有一定的依賴關係。所以需要按順序啓動。執行情況如下圖: