一文讓你徹底瞭解大數據實時計算引擎 Flink

前言

在上一篇文章你公司到底需不需要引入實時計算引擎？中我講解了日常中常見的實時需求，然後分析了這些需求的實現方式，接着對比了實時計算和離線計算。隨着這些年大數據的飛速發展，也出現了不少計算的框架（Hadoop、Storm、Spark、Flink）。在網上有人將大數據計算引擎的發展分爲四個階段。

第一代：Hadoop 承載的 MapReduce
第二代：支持 DAG（有向無環圖）框架的計算引擎 Tez 和 Oozie，主要還是批處理任務
第三代：支持 Job 內部的 DAG（有向無環圖），以 Spark 爲代表
第四代：大數據統一計算引擎，包括流處理、批處理、AI、Machine Learning、圖計算等，以 Flink 爲代表

或許會有人不同意以上的分類，我覺得其實這並不重要的，重要的是體會各個框架的差異，以及更適合的場景。並進行理解，沒有哪一個框架可以完美的支持所有的場景，也就不可能有任何一個框架能完全取代另一個。

本文將對 Flink 的整體架構和 Flink 的多種特性做個詳細的介紹！在講 Flink 之前的話，我們先來看看 數據集類型 和 數據運算模型 的種類。

數據集類型

無窮數據集：無窮的持續集成的數據集合
有界數據集：有限不會改變的數據集合

那麼那些常見的無窮數據集有哪些呢？

用戶與客戶端的實時交互數據
應用實時產生的日誌
金融市場的實時交易記錄
…

數據運算模型

流式：只要數據一直在產生，計算就持續地進行
批處理：在預先定義的時間內運行計算，當計算完成時釋放計算機資源

那麼我們再來看看 Flink 它是什麼呢？

Flink 是什麼？

Flink 是一個針對流數據和批數據的分佈式處理引擎，代碼主要是由 Java 實現，部分代碼是 Scala。它可以處理有界的批量數據集、也可以處理無界的實時數據集。對 Flink 而言，其所要處理的主要場景就是流數據，批數據只是流數據的一個極限特例而已，所以 Flink 也是一款真正的流批統一的計算引擎。

Flink 提供了 State、Checkpoint、Time、Window 等，它們爲 Flink 提供了基石，本篇文章下面會稍作講解，具體深度分析後面會有專門的文章來講解。

Flink 整體結構

從下至上：

1、部署：Flink 支持本地運行（IDE 中直接運行程序）、能在獨立集羣（Standalone 模式）或者在被 YARN、Mesos、K8s 管理的集羣上運行，也能部署在雲上。

2、運行：Flink 的核心是分佈式流式數據引擎，意味着數據以一次一個事件的形式被處理。

3、API：DataStream、DataSet、Table、SQL API。

4、擴展庫：Flink 還包括用於 CEP（複雜事件處理）、機器學習、圖形處理等場景。

Flink 支持多種方式部署

Flink 支持多種模式下的運行。

Local：直接在 IDE 中運行 Flink Job 時則會在本地啓動一個 mini Flink 集羣
Standalone：在 Flink 目錄下執行 bin/start-cluster.sh 腳本則會啓動一個 Standalone 模式的集羣
YARN：YARN 是 Hadoop 集羣的資源管理系統，它可以在羣集上運行各種分佈式應用程序，Flink 可與其他應用並行於 YARN 中，Flink on YARN 的架構如下：

Kubernetes：Kubernetes 是 Google 開源的容器集羣管理系統，在 Docker 技術的基礎上，爲容器化的應用提供部署運行、資源調度、服務發現和動態伸縮等一系列完整功能，提高了大規模容器集羣管理的便捷性，Flink 也支持部署在 Kubernetes 上，在 GitHub 看到有下面這種運行架構的。

通常上面四種居多，另外還支持 AWS、MapR、Aliyun OSS 等。

Flink 分佈式運行

Flink 作業提交架構流程可見下圖：

1、Program Code：我們編寫的 Flink 應用程序代碼

2、Job Client：Job Client 不是 Flink 程序執行的內部部分，但它是任務執行的起點。 Job Client 負責接受用戶的程序代碼，然後創建數據流，將數據流提交給 Job Manager 以便進一步執行。執行完成後，Job Client 將結果返回給用戶

3、Job Manager：主進程（也稱爲作業管理器）協調和管理程序的執行。它的主要職責包括安排任務，管理 checkpoint ，故障恢復等。機器集羣中至少要有一個 master，master 負責調度 task，協調 checkpoints 和容災，高可用設置的話可以有多個 master，但要保證一個是 leader, 其他是 standby; Job Manager 包含 Actor system、Scheduler、Check pointing 三個重要的組件

4、Task Manager：從 Job Manager 處接收需要部署的 Task。Task Manager 是在 JVM 中的一個或多個線程中執行任務的工作節點。任務執行的並行性由每個 Task Manager 上可用的任務槽（Slot 個數）決定。每個任務代表分配給任務槽的一組資源。例如，如果 Task Manager 有四個插槽，那麼它將爲每個插槽分配 25％的內存。可以在任務槽中運行一個或多個線程。同一插槽中的線程共享相同的 JVM。
同一 JVM 中的任務共享 TCP 連接和心跳消息。Task Manager 的一個 Slot 代表一個可用線程，該線程具有固定的內存，注意 Slot 只對內存隔離，沒有對 CPU 隔離。默認情況下，Flink 允許子任務共享 Slot，即使它們是不同 task 的 subtask，只要它們來自相同的 job。這種共享可以有更好的資源利用率。

Flink API

Flink 提供了不同的抽象級別的 API 以開發流式或批處理應用。

最底層提供了有狀態流。它將通過 Process Function 嵌入到 DataStream API 中。它允許用戶可以自由地處理來自一個或多個流數據的事件，並使用一致性、容錯的狀態。除此之外，用戶可以註冊事件時間和處理事件回調，從而使程序可以實現複雜的計算。
DataStream / DataSet API 是 Flink 提供的核心 API ，DataSet 處理有界的數據集，DataStream 處理有界或者無界的數據流。用戶可以通過各種方法（map / flatmap / window / keyby / sum / max / min / avg / join 等）將數據進行轉換或者計算。
Table API 是以表爲中心的聲明式 DSL，其中表可能會動態變化（在表達流數據時）。Table API 提供了例如 select、project、join、group-by、aggregate 等操作，使用起來卻更加簡潔（代碼量更少）。

你可以在表與 DataStream/DataSet 之間無縫切換，也允許程序將 Table API 與 DataStream 以及 DataSet 混合使用。

Flink 提供的最高層級的抽象是 SQL 。這一層抽象在語法與表達能力上與 Table API 類似，但是是以 SQL查詢表達式的形式表現程序。SQL 抽象與 Table API 交互密切，同時 SQL 查詢可以直接在 Table API 定義的表上執行。

Flink 程序與數據流結構

一個完整的 Flink 應用程序結構就是如上兩圖所示：

1、Source：數據輸入，Flink 在流處理和批處理上的 source 大概有 4 類：基於本地集合的 source、基於文件的 source、基於網絡套接字的 source、自定義的 source。自定義的 source 常見的有 Apache kafka、Amazon Kinesis Streams、RabbitMQ、Twitter Streaming API、Apache NiFi 等，當然你也可以定義自己的 source。

2、Transformation：數據轉換的各種操作，有 Map / FlatMap / Filter / KeyBy / Reduce / Fold / Aggregations / Window / WindowAll / Union / Window join / Split / Select / Project 等，操作很多，可以將數據轉換計算成你想要的數據。

3、Sink：數據輸出，Flink 將轉換計算後的數據發送的地點，你可能需要存儲下來，Flink 常見的 Sink 大概有如下幾類：寫入文件、打印出來、寫入 socket 、自定義的 sink 。自定義的 sink 常見的有 Apache kafka、RabbitMQ、MySQL、ElasticSearch、Apache Cassandra、Hadoop FileSystem 等，同理你也可以定義自己的 sink。

Flink 支持多種擴展庫

Flink 擁有豐富的庫來進行機器學習，圖形處理，關係數據處理等。由於其架構，很容易執行復雜的事件處理和警報。

Flink 提供多種 Time 語義

Flink 支持多種 Time，比如 Event time、Ingestion Time、Processing Time，後面的文章 [Flink 中 Processing Time、Event Time、Ingestion Time 對比及其使用場景分析]() 中會很詳細的講解 Flink 中 Time 的概念。

Flink 提供靈活的窗口機制

Flink 支持多種 Window，比如 Time Window、Count Window、Session Window，還支持自定義 Window。後面的文章 [如何使用 Flink Window 及 Window 基本概念與實現原理]() 中會很詳細的講解 Flink 中 Window 的概念。

Flink 並行的執行任務

Flink 的程序內在是並行和分佈式的，數據流可以被分區成 stream partitions，operators 被劃分爲 operator subtasks; 這些 subtasks 在不同的機器或容器中分不同的線程獨立運行；
operator subtasks 的數量在具體的 operator 就是並行計算數，程序不同的 operator 階段可能有不同的並行數；如下圖所示，source operator 的並行數爲 2，但最後的 sink operator 爲 1：