kettle 使用

軟件設置
配置Java環境,最好配置JAVA1.7以上
處理之後的數據中文亂碼
開發庫和測試庫是同一個mysql數據庫服務器下不同的shemas而已,最後導到測試庫的數據庫出現中文亂碼。
然後就開始百度了:
添加characterEncoding爲utf8的設置,可以看到數據源連接的高級選項中都已經顯示的制定字符集爲utf8,但是文本文件輸出和插入數據都是亂碼;
數據庫字符集都是utf8的,我試着指定爲characterEncoding=gbk,然而還是亂碼。

最後:

在jvm的啓動參數中,添加參數-Dfile.encoding=UTF-8,亂碼問題就解決了(PS:kettle在windows下跑的,然而數據庫是utf8,這是個坑)。貼在這裏吧,如果你試了很多方法都不行,不妨指定kettle這個程序的字符集。

顯示正常

設置數據清洗

sh /home/data/kettle/data-integration/kitchen.sh -file=/home/data/kettle/data-integration/105-106.kjb -logfile=/var/log/kettle.log
執行以上命令即可

遇到驅動報錯需要將
window端
需要將MySQL驅動,jar包放到lib目錄下 重新啓動kettle即可
linux端
需要將MySQL驅動,jar包放到libext/JBDDC目錄下 重新啓動kettle即可

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章