原创 比Hive快800倍:大數據實時分析領域黑馬開源ClickHouse

ClickHouse 是俄羅斯最大的搜索公司 Yandex 推出的大數據存儲和開源組件,在 2017 年易觀 OLAP 大賽獲得黑馬冠軍之後,得到了大量的媒體曝光和開發者的認同,大家戲稱這是俄羅斯送來的“喀秋莎數據庫”。本文將深入淺出的講

原创 Apache Beam實戰指南 | 大數據管道(pipeline)設計及實戰

本文是Apache Beam 實戰指南系列文章第五篇內容,將對 Beam 框架中的 pipeline 管道進行剖析,並結合應用示例介紹如何設計和應用Beam管道。系列文章第一篇回顧Apache Beam 實戰指南 | 基礎入門、第二篇回

原创 Apache Beam實戰指南 | 如何結合ClickHouse打造“AI微服務”?

本文是Apache Beam 實戰指南系列文章的第四篇內容,將對 Beam 框架中的 ClickHouseIO 源碼進行剖析,並結合應用示例和代碼解讀帶你進一步瞭解如何結合 Beam 玩轉大數據實時分析數據庫ClickHouse。系列文章

原创 Apache Beam實戰指南 | 玩轉大數據存儲HdfsIO

本文是 Apache Beam實戰指南系列文章 的第三篇內容,將對Beam框架中的HDFSIO和MySQLIO源碼進行剖析,並結合應用示例和代碼解讀帶你進一步瞭解如何結合Beam玩轉大數據存儲重要組件HDFS。 系列文章第一篇回顧:Apac