ETL - Kettle基础入门(实战篇)

前言:

Kettle是一个用于做数据ETL的工具,所谓ETL则为:将数据从来源端经过抽取(extract)、转换(transform)、加载(load)至目的端的过程,ETL一词较常用在数据仓库,但其对象并不限于数据仓库。

 Kettle实战

一、基本数据导入导出

01. CSV To Excel(CSV数据文件生成Excel数据文件)

主页

 新键一个转换

        

 设置一个CSV文件输入组件

 配置CSV文件输入组件

 拖拽出一个Excel输出组件

 让两个组件的数据进行流通

Shift + 鼠标左键选择一个组件

配置输出的Excel组件

 

 准备启动转换任务

 提前保存这个KTR文件

 执行并验证结果

02. JSON To Excel(JSON数据文件生成Excel数据文件)

创建第二个转换

添加一个JSON文件输入组件

配置JSON输入组件

添加一个输出的Excel组件

并让输入组件与输出组件进行关联(Shfit + 鼠标左键 )

配置输出的Excel组件

Crtl + s 保存文件为KTR文件

 执行JSONToExcel任务

 

验证数据

 

Kettle能做的事情有很多

输入组件

 输出组件

也可以添加脚本文件

还可以添加流程控制组件

这些组件可以进行随机搭配,就需要大家自己去探索了哦,我慢慢后期也会写一些组件的流程!!!拜拜

👇看完点赞哦👍 养成习惯哦!!!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章