原创 基於Flink+Hive構建流批一體準實時數倉

基於 Hive 的離線數倉往往是企業大數據生產系統中不可缺少的一環。Hive 數倉有很高的成熟度和穩定性,但由於它是離線的,延時很大。在一些對延時要求比較高的場景,需要另外搭建基於 Flink 的實時數倉,將鏈路延時降低到秒級。但是一套離線

原创 深度解讀:Flink 1.11 SQL流批一體的增強與完善

7月6日,Apache Flink 1.11 正式發佈。從3月初進行功能規劃到7月初正式發版,1.11 用將近4個月的時間重點優化了 Flink 的易用性問題,提升用戶的生產使用體驗。 SQL 作爲 Flink 中公認的核心模塊之一,對推動

原创 深度解讀Flink 1.11:流批一體Hive數倉

Flink 1.11 features 已經凍結,流批一體在新版中是濃墨重彩的一筆,在此提前對 Flink 1.11 中流批一體方面的改善進行深度解讀,大家可期待正式版本的發佈。 Flink 1.11 中流計算結合 Hive 批處理數倉,給