文章目錄
Kettle是一款國外開源的ETL工具,純java編寫,可以在Window、Linux、Unix上運行,綠色無需安裝,數據抽取高效穩定。
Kettle這個ETL工具集,它允許你管理來自不同數據庫的數據,通過提供一個圖形化的用戶環境來描述你想做什麼,而不是你想怎麼做。Kettle中有兩種腳本文件,transformation和job,transformation完成針對數據的基礎轉換,job則完成整個工作流的控制。作爲Pentaho的一個重要組成部分,現在在國內項目應用上逐漸增多。
1 下載安裝
- 各個版本下載地址: 這裏以pdi-ce-7.1.0.0-12.zip爲例
- JDK的版本在1.7以上。
- 需要數據庫驅動,這裏以mysql爲例:將myslq的驅動mysql-connector-java-5.1.47.jar放在kettle解壓後的文件lib裏面。
2 打開圖形界面
window雙擊打開Spoon.dat
3 transformation腳本
3.1 文件 -> 新建 -> 轉換
3.2 建DB連接
3.3 核心對象 -> 輸入 -> 表輸入
雙擊表輸入
3.4 核心對象 -> 輸出 -> 插入/更新
雙擊插入/更新
3.5 運行
可以看日誌等
4 job腳本
4.1 文件->新建->作業
4.2 畫圖
將start,轉換和成功拖動右邊,並連好線。
4.3 雙擊start
設置時間間隔,這裏設置爲1分鐘。