kettle從Excel中讀取數據導入數據庫

kettle是個開源的ETL工具,能將多種形式的數據源數據抓取到數據庫中。

將Excel文件中的數據導入數據庫。

1.創建一個轉換,單擊文件->文件->轉換。

2.從輸入菜單中選擇Excel輸入。

3.配置要導入的 Excel文件,點擊瀏覽選擇文件。

153027275.png


如果想讀取文件夾下以.xls爲後綴的文件,kettle支持正則表達式,在規則表達式中寫入正則表達式^.+\.xls$。點擊“增加”,增加文件或目錄和規則表達式。

154055716.png


可以單擊“顯示文件名稱”測試正則表達式是否正確。

154316188.png


4.配置sheet頁名稱,選擇“工作表”Tab頁,點擊"獲取獲取工作表名稱",在可用項目中選擇sheet頁名稱

154941535.png

5.配置文件中導入字段。選擇“字段”Tab頁,點擊“獲取來自頭部數據字段”。

161709648.png


6.配置導入的數據庫 ,在輸出菜單中選擇表輸出。配置數據源和要輸出的表名。如果沒有數據庫連接可點擊“新建”,配置對應數據庫的連接,注:在使用JDBC時,需要對應的驅動包。

155637829.png

7.配置文件與表之間的映射關係。在“表輸出”中選擇“database fields”,點擊“enter field mapping”,選擇mapping關係。

162430993.png

Excel文件中的數據導入數據庫的配置已經完成。點擊運行。

163109794.png

可將作業與轉換整合,定時掃描文件夾將Excel文件中的數據導入數據庫。

1.創建一個作業,單擊文件->文件->作業。

2.在“通用”菜單中選擇START,配置作業的時間以及間隔時間。

163815661.png


3.在“通用”菜單中選擇Transformation,配置轉換。

164016820.png

4.在“通用”菜單中選擇Success。

164224643.png


作業已經與轉換關聯起來,根據設置的時間會定時執行作業。點擊“運行“。

165112172.png




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章