Matt Casters的博客:http://www.ibridge.be/
、 www.kettle.be
書籍:
《Pentaho Kettle解決方案:使用PDI構建開源ETL解決方案》
鏈接:https://pan.baidu.com/s/15iUOWOCb8g_YLo5WN9fh0A 提取碼:5upf
kettle起源
Kettle一詞起源於“KDE ETTL Environment”,因爲最開始的計劃是在K Desktop Environment(www.kde.org)上開發這個軟件。在這個計劃被取消後,才把它重命名爲“Kettle ETTL Environment”.
kettle的設計
- 開放,可讀的元數據格式(xml)
- 開放,可讀的關係型資源庫格式
- 開放的api
- 容易安裝(少於2分鐘)
- 對各類數據庫開放
- 容易使用的圖形用戶界面
- 容易傳送數據
- 容易把數據轉換成各種格式
kettle的性能瓶頸應該主要在於數據的編碼和解碼。所以kettle的一個設計原則就是儘量不做數據的轉換
插曲
2001年Matt就有了開發一個自己的ETL工具的想法
Matt:"我想寫一個ETL軟件。但這回佔用我晚上和週末的時間"
Kathleen(Matt的夫人):“oh,太好了!要用多長時間?”
Matt:“如果一切順利,第一個能運行的版本應該用三年時間,第一個完整的版本要用5年。”