【Kettle】整合Hive進行操作

現在我們來講講kettle如何整合hive進行操作

開啓hiveserver2服務

cd  /export/servers/hive-1.1.0-cdh5.14.0 nohup bin/hive --service hiveserver2  &

連接hive

hive

創建並切換數據庫

create database test; 
use test;

創建表

create table a(a int,b int) row format delimited fields terminated by ',' stored as TEXTFILE; show tables;

創建數據文件

vim a.txt 

1,11 
2,22 
3,33

從文件加載數據到表

load data local inpath '/root/a.txt' into table a;

查詢表

select * from a;

修改權限，因爲下面有些操作需要權限

hadoop fs -chmod -R 777 /tmp/hadoop-yarn

從虛擬機下載Hadoop的jar包

sz /export/servers/hadoop-2.6.0-cdh5.14.0/share/hadoop/common/hadoop-common-2.6.0-cdh5.14.0.jar

把jar包放置在\data-integration\lib目錄下

重啓kettle，重新加載生效

hive數據庫是通過jdbc來進行連接，可以通過表輸入控件來獲取數據，從hive數據庫的test庫的a表中獲取數據，並把數據保存到Excel中。

拖拽一個表輸入組件、一個Excel輸出組件、並按住Shift拖動鼠標連接兩個組件

配置表輸入組件

配置Excel輸出組件

點擊三角形箭頭執行

拖拽一個Excel輸入組件、一個表輸出組件、並按住Shift拖動鼠標連接兩個組件

配置Excel輸入組件

配置表輸出組件

點擊三角形箭頭執行

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.