Delta Lake 如何幫助雲用戶解決數據實時入庫問題

嘉賓簡介:辛現銀,花名辛庸,阿里巴巴計算平臺事業部 EMR 技術專家,Apache Hadoop,Apache Spark contributor,對 Hadoop、Spark、Hive、Druid 等大數據組件有深入研究。目前從事大數據雲化相關工作,專注於計算引擎、存儲結構、數據庫事務等內容,今天爲大家介紹Delta Lake 如何幫助雲用戶解決數據實時入庫的問題。

直播回放:https://developer.aliyun.com/live/2894

以下是視頻內容精華整理。


一、CDC簡介

CDC是Change Data Capture的縮寫,也就是改變數據捕獲。比如在最開始的時候我們用工具將業務數據導入數據倉庫、數據湖當中,之後導入數據的時候我們希望反映數據的動態變化,進行增量導入,並且能夠儘快的捕獲這些變化數據,以便更快地進行後



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章