Kettle與Hadoop(六)執行HiveQL語句

1. 建立hive表,導入原始數據,過程參考

https://blog.csdn.net/wzy0623/article/details/106471124#2.%20%E5%90%91Hive%E5%AF%BC%E5%85%A5%E6%95%B0%E6%8D%AE

2.  建立一個作業,查詢hive表,並將聚合數據寫入一個hive表。
(1)打開PDI,新建一個作業,如圖1所示。

圖1

(2)編輯'SQL'作業項,如圖2所示。

圖2

        說明:hive_cdh631是已經建好的hive數據庫連接,參見https://wxy0327.blog.csdn.net/article/details/106406702#%E4%B8%89%E3%80%81%E8%BF%9E%E6%8E%A5Hive

3. 保存並執行作業,日誌如圖3所示。

圖3

        從圖3可以看到,作業已經成功執行。

4. 檢查hive表,結果如圖4所示。

圖4

        從圖4可以看到,新建了weblogs_agg表,並裝載了聚合數據。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章