數據庫增量同步/ETL工具

數據同步與訂閱:

比較推薦的是阿里的Canal、Zendesk的Maxwell、以及來自社區的Python-Mysql-Replication

ETL工具

  • kettle

Kettle 是一款國外開源的 ETL 工具,純 Java 編寫,綠色無需安裝,數據抽取高效穩定(數據遷移工具)。Kettle 中有兩種腳本文件,transformation 和 job,transformation 完成針對數據的基礎轉換,job 則完成整個工作流的控制。

github: https://github.com/pentaho/pentaho-kettle/

kettle中文網 https://www.kettle.net.cn/

  • Apache aireflow

Airflow 被 Airbnb 內部用來創建、監控和調整數據管道。任何工作流都可以在這個使用 Python 編寫的平臺上運行(目前加入 Apache 基金會孵化器)。

中文文檔 https://github.com/apachecn/airflow-doc-zh, https://airflow.apachecn.org/#/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章