hive:類似一個數據倉庫,管理hadoop的數據,同時可以查看hadoop數據,hive類似一個sql的解析引擎,hive可以把sql的操作轉換爲MR的作業,所以hive操作語言 也叫HSQL,數據的存放一般放在derby 和 mysql中。derby 默認 ,由於其侷限性,不予使用,筆者採用mysql數據庫。
版本:
hadoop1.2.1:
apache-hive-0.13.1-bin.tar.gz
mysql-5.5-server
mysql-5.5-client
mysql-connector-java-5.1.10.jar
1.首先安裝 mysql
sudo apt-get install mysql-server
sudo apt-get install mysql-client
sudo apt-get install libmysqlclient-dev
2. 根據提示設置mysql
3.安裝hive
拷貝hive到/usr
3.1 解壓:
sudo tar -zxvf apache-hive-0.13.1-bin.tar.gz
3.2 重命名:
sudo mv hive-0.13.1 hive
3.3 環境變量:
sudo vim /etc/profile
注意 hive_home 和 path
source /etc/profile
3.4 在/usr/hive/conf 將以下文件改名
sudo mv hive-default.xml.template hive-site.xml
sudo mv hive-env.sh.template hive-env.sh
3.5 修改hadoop 下的hadoop-env.sh 文件
3.6 修改/usr/hive/bin/hive-config.sh
3.7 hive安裝完成
進入 bin/下面 執行hive 進入hive shell
4 mysql與hive相連:
4.1 先將mysql-connector-java-5.1.10.jar 拷貝到/usr/hive/lib下面
4.2 修改配置文件 /usr/hive/conf/hive-site.xml(改名後)
表存放位置 hdfs下:
關於mysql的設置:根據自己的mysql配置
5. 測試鏈接成功:
mysql -uroot -p密碼
show databases;
就會看見hive的數據庫。
6. 可以在hive創建表的操作。