關於HIVE增量同步的思考

方案一、如果業務庫沒有刪除操作,並且更新時間完整,使用更新時間做增量同步,sqoop只同步更新時間變化的數據,合併到ODS層表

方案二、如果業務庫有刪除操作,可以先解析數據庫操作日誌,存到hdfs,T+1同步數據後,對增刪改做一次merge操作即可,可能需要代碼實現。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章