方案一、如果業務庫沒有刪除操作,並且更新時間完整,使用更新時間做增量同步,sqoop只同步更新時間變化的數據,合併到ODS層表
方案二、如果業務庫有刪除操作,可以先解析數據庫操作日誌,存到hdfs,T+1同步數據後,對增刪改做一次merge操作即可,可能需要代碼實現。
方案一、如果業務庫沒有刪除操作,並且更新時間完整,使用更新時間做增量同步,sqoop只同步更新時間變化的數據,合併到ODS層表
方案二、如果業務庫有刪除操作,可以先解析數據庫操作日誌,存到hdfs,T+1同步數據後,對增刪改做一次merge操作即可,可能需要代碼實現。