1,hive的安裝
apache所有項目的歷史版本網址:archive.apache.org
(1)hive基於Hadoop,要安裝hive先要安裝hadoop
(2)安裝模式
–嵌入模式
元數據信息被存儲在hive自帶的derby數據庫中
只允許創建一個連接
多用於Demo
–本地模式
元數據信息被存儲在mysql數據庫中
MySQL數據庫與hive運行在同一臺物理機上
多用於開發測試
–遠程模式
元數據信息被存儲在mysql數據庫中
MySQL數據庫與hive運行在不同的物理機上
2 hive的嵌入式安裝
Hive是爲了解決hadoop中mapreduce編寫困難,提供給熟悉sql的人使用的。只要你對SQL有一定的瞭解,就能通過Hive寫出mapreduce的程序,而不需要去學習hadoop中的api。
在部署前需要確認安裝jdk以及Hadoop。
(1),到官網下載hive包,一般命名爲hive-x.y.z.tar.gz,然後解壓
//linux解壓命令
$ tar -xzvf hive-x.y.z.tar.gz/
(2),設置環境變量 HIVE_HOME = 安裝目錄:
(3),加入$HIVE_HOME/bin到你的path
$ export PATH=$HIVE_HOME/bin:$PATH
(4),運行下面的命令,新建文件夾作爲hive存放數據文件(默認在/user/hive/warehouse)和臨時文件(默認在/tmp目錄下)的目錄
$ $HADOOP_HOME/bin/hadoop fs -mkdir /tmp
$ $HADOOP_HOME/bin/hadoop fs -mkdir /user/hive/warehouse
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /tmp
$ $HADOOP_HOME/bin/hadoop fs -chmod g+w /user/hive/warehouse
如果需要修改目錄,需要修改$HIVE_HOME/conf/hive-site.xml中的配置。
(5),初始化元數據數據庫,這裏以默認的derby數據庫作爲元數據庫
//語法
$HIVE_HOME/bin/schematool -dbType <db type> -initSchema
//執行實例
$HIVE_HOME/bin/schematool -dbType derby -initSchema
注意:這裏需要在hive-site.xml配置hive的源數據的路徑,否則不能在不同目錄下啓動hive,配置如下:
<property>
<name>javax.jdo.option.ConnectionURL</name>
<value>jdbc:derby:;databaseName=/usr/hive/metastore_db;create=true</value>
<description>
JDBC connect string for a JDBC metastore.
To use SSL to encrypt/authenticate the connection, provide database-specific SSL flag in the connection URL.
For example, jdbc:postgresql://myhost/db?ssl=true for postgres database.
</description>
</property>
<property>
<name>hive.metastore.warehouse.dir</name>
<value>/user/hive/warehouse</value>
</property>
(6),使用hive命令就可以啓動hiveshell了,
$HIVE_HOME/bin/hive
3,hive的遠程安裝和本地安裝
http://www.cnblogs.com/tq03/p/5107949.html