Apache Flink DataStream教案

概述

Flink是構建在數據流之上的有狀態計算的流計算框架,通常被人們理解爲是第三代大數據分析方案。

  • 第一代 - Hadoop的MapReduce計算(靜態)、Storm流計算(2014.9) ;兩套獨立計算引擎,使用難度大
  • 第二代 - Spark RDD 靜態批處理(2014.2)、DStream|Structured Streaming 流計算;統一計算引擎,難度係數小
  • 第三代 - Flink DataStream(2014 .12) 流計算框架、Flink Dataset 批處理;統一計算引擎,難度係數不低也不高

可以看出Spark和Flink幾乎同時誕生,但是Flink之所以發展慢,是因爲早期人們對大數據的分析的認知不夠深刻或者當時業務場景大都侷限在批處理領域,從而導致了Flink的發展相比較於Spark較爲緩慢,直到2016年人們纔開始慢慢的意識流計算的重要性。

流計算領域:系統監控、輿情監控、交通預測、國家電網、疾病預測、銀行/金融風控等。

更多詳細分析:https://blog.csdn.net/weixin_38231448/article/details/100062961

Spark VS Flink戰略
Spark VS Flink戰略

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章