kettle是個開源的ETL工具,能將多種形式的數據源數據抓取到數據庫中。
將Excel文件中的數據導入數據庫。
1.創建一個轉換,單擊文件->文件->轉換。
2.從輸入菜單中選擇Excel輸入。
3.配置要導入的 Excel文件,點擊瀏覽選擇文件。
如果想讀取文件夾下以.xls爲後綴的文件,kettle支持正則表達式,在規則表達式中寫入正則表達式^.+\.xls$。點擊“增加”,增加文件或目錄和規則表達式。
可以單擊“顯示文件名稱”測試正則表達式是否正確。
4.配置sheet頁名稱,選擇“工作表”Tab頁,點擊"獲取獲取工作表名稱",在可用項目中選擇sheet頁名稱。
5.配置文件中導入字段。選擇“字段”Tab頁,點擊“獲取來自頭部數據字段”。
6.配置導入的數據庫 ,在輸出菜單中選擇表輸出。配置數據源和要輸出的表名。如果沒有數據庫連接可點擊“新建”,配置對應數據庫的連接,注:在使用JDBC時,需要對應的驅動包。
7.配置文件與表之間的映射關係。在“表輸出”中選擇“database fields”,點擊“enter field mapping”,選擇mapping關係。
Excel文件中的數據導入數據庫的配置已經完成。點擊運行。
可將作業與轉換整合,定時掃描文件夾將Excel文件中的數據導入數據庫。
1.創建一個作業,單擊文件->文件->作業。
2.在“通用”菜單中選擇START,配置作業的時間以及間隔時間。
3.在“通用”菜單中選擇Transformation,配置轉換。
4.在“通用”菜單中選擇Success。
作業已經與轉換關聯起來,根據設置的時間會定時執行作業。點擊“運行“。