數據同步與訂閱:
比較推薦的是阿里的Canal、Zendesk的Maxwell、以及來自社區的Python-Mysql-Replication
ETL工具
- kettle
Kettle 是一款國外開源的 ETL 工具,純 Java 編寫,綠色無需安裝,數據抽取高效穩定(數據遷移工具)。Kettle 中有兩種腳本文件,transformation 和 job,transformation 完成針對數據的基礎轉換,job 則完成整個工作流的控制。
github: https://github.com/pentaho/pentaho-kettle/
kettle中文網 https://www.kettle.net.cn/
- Apache aireflow
Airflow 被 Airbnb 內部用來創建、監控和調整數據管道。任何工作流都可以在這個使用 Python 編寫的平臺上運行(目前加入 Apache 基金會孵化器)。
中文文檔 https://github.com/apachecn/airflow-doc-zh, https://airflow.apachecn.org/#/