【Kettle】整合Hive進行操作

  • 前言

現在我們來講講kettle如何整合hive進行操作

 

  • 準備環境

開啓hiveserver2服務

cd  /export/servers/hive-1.1.0-cdh5.14.0 nohup bin/hive --service hiveserver2  &

 

連接hive

hive

 

創建並切換數據庫

create database test; 
use test;

 

創建表

create table a(a int,b int) row format delimited fields terminated by ',' stored as TEXTFILE; show tables;

 

創建數據文件

vim a.txt 

1,11 
2,22 
3,33

 

從文件加載數據到表

load data local inpath '/root/a.txt' into table a;

 

查詢表

select * from a;

 

修改權限,因爲下面有些操作需要權限

hadoop fs -chmod -R 777 /tmp/hadoop-yarn

 

  • kettle與Hive整合

從虛擬機下載Hadoop的jar包

sz /export/servers/hadoop-2.6.0-cdh5.14.0/share/hadoop/common/hadoop-common-2.6.0-cdh5.14.0.jar

 

把jar包放置在\data-integration\lib目錄下

 

重啓kettle,重新加載生效

 

  • 從hive中讀取數據到Excel

hive數據庫是通過jdbc來進行連接,可以通過表輸入控件來獲取數據,從hive數據庫的test庫的a表中獲取數據,並把數據保存到Excel中。

 

拖拽一個表輸入組件、一個Excel輸出組件、並按住Shift拖動鼠標連接兩個組件

 

配置表輸入組件

 

配置Excel輸出組件

點擊三角形箭頭執行

 

  • 從Excel中讀取數據到hive

拖拽一個Excel輸入組件、一個表輸出組件、並按住Shift拖動鼠標連接兩個組件

配置Excel輸入組件

 

配置表輸出組件

點擊三角形箭頭執行

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章