1. 建立hive表,導入原始數據,過程參考
2. 建立一個作業,查詢hive表,並將聚合數據寫入一個hive表。
(1)打開PDI,新建一個作業,如圖1所示。
(2)編輯'SQL'作業項,如圖2所示。
說明:hive_cdh631是已經建好的hive數據庫連接,參見https://wxy0327.blog.csdn.net/article/details/106406702#%E4%B8%89%E3%80%81%E8%BF%9E%E6%8E%A5Hive。
3. 保存並執行作業,日誌如圖3所示。
從圖3可以看到,作業已經成功執行。
4. 檢查hive表,結果如圖4所示。
從圖4可以看到,新建了weblogs_agg表,並裝載了聚合數據。