第五節 hive的安裝

1,hive的安裝
apache所有項目的歷史版本網址:archive.apache.org
(1)hive基於Hadoop,要安裝hive先要安裝hadoop
(2)安裝模式
–嵌入模式
元數據信息被存儲在hive自帶的derby數據庫中
只允許創建一個連接
多用於Demo
–本地模式
元數據信息被存儲在mysql數據庫中
MySQL數據庫與hive運行在同一臺物理機上
多用於開發測試
–遠程模式
元數據信息被存儲在mysql數據庫中
MySQL數據庫與hive運行在不同的物理機上

2 hive的嵌入式安裝
Hive是爲了解決hadoop中mapreduce編寫困難,提供給熟悉sql的人使用的。只要你對SQL有一定的瞭解,就能通過Hive寫出mapreduce的程序,而不需要去學習hadoop中的api。
在部署前需要確認安裝jdk以及Hadoop。
(1),到官網下載hive包,一般命名爲hive-x.y.z.tar.gz,然後解壓

  //linux解壓命令 
  $ tar -xzvf hive-x.y.z.tar.gz/

(2),設置環境變量 HIVE_HOME = 安裝目錄:
(3),加入$HIVE_HOME/bin到你的path

$ export PATH=$HIVE_HOME/bin:$PATH

(4),運行下面的命令,新建文件夾作爲hive存放數據文件(默認在/user/hive/warehouse)和臨時文件(默認在/tmp目錄下)的目錄

$ $HADOOP_HOME/bin/hadoop fs -mkdir       /tmp
$ $HADOOP_HOME/bin/hadoop fs -mkdir       /user/hive/warehouse
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w   /tmp
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w   /user/hive/warehouse   

如果需要修改目錄,需要修改$HIVE_HOME/conf/hive-site.xml中的配置。
(5),初始化元數據數據庫,這裏以默認的derby數據庫作爲元數據庫

//語法    
$HIVE_HOME/bin/schematool -dbType <db type> -initSchema
//執行實例
$HIVE_HOME/bin/schematool -dbType derby -initSchema

注意:這裏需要在hive-site.xml配置hive的源數據的路徑,否則不能在不同目錄下啓動hive,配置如下:

  <property>
    <name>javax.jdo.option.ConnectionURL</name>
    <value>jdbc:derby:;databaseName=/usr/hive/metastore_db;create=true</value>
    <description>
      JDBC connect string for a JDBC metastore.
      To use SSL to encrypt/authenticate the connection, provide database-specific SSL flag in the connection URL.
      For example, jdbc:postgresql://myhost/db?ssl=true for postgres database.
    </description>
  </property>
  <property>
   <name>hive.metastore.warehouse.dir</name>
   <value>/user/hive/warehouse</value>
  </property>

(6),使用hive命令就可以啓動hiveshell了,

$HIVE_HOME/bin/hive

3,hive的遠程安裝和本地安裝
http://www.cnblogs.com/tq03/p/5107949.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章