一.整體概述

1.1 什麼是 Table API 和 Flink SQL

Flink本身是批流統一的處理框架，所以Table API和 SQL，就是批流統一的上層處理 API。目前功能尚未完善，處於活躍的開發階段。

Table API是一套內嵌在一套內嵌在一套內嵌在 Java和 Scala語言中的語言中的查詢 API，它允許我們以非常直觀的方式組合來自一些關係運算符的查詢（比如（比如 select、filter和 join）。而對於 Flink SQL，就是直接可以在代碼中寫中寫 SQL，來實現一些查詢（ Query）操作。 Flink的 SQL支持，基於實現基於實現了 SQL標準的 Apache Calcite（Apache開源 SQL解析工具）。

無論輸入是批輸入還是流式輸入，在這兩套這兩套 API中，指定的查詢都具有相同語義，得到相同的結果。

1.2 需要引入的pom依賴

Table API和 SQL需要引入的依賴有兩個：planner和 bridge。

 <!-- Table API 和 Flink SQL -->
    <dependency>
      <groupId>org.apache.flink</groupId>
      <artifactId>flink-table-planner_2.11</artifactId>
      <version>1.9.0</version>
    </dependency>
    <dependency>
      <groupId>org.apache.flink</groupId>
      <artifactId>flink-table-api-java-bridge_2.11</artifactId>
      <version>1.9.0</version>
    </dependency>

<!-- Table API 和 Flink SQL -->
<dependency>
      <groupId>org.apache.flink</groupId>
      <artifactId>flink-table-planner-blink_2.11</artifactId>
      <version>1.9.0</version>
    </dependency>

flink-table-planner：planner計劃器，是 table API最主要的部分，提供了運行時環境和生成程序執行計劃的 planner；

flink-table-api-java-bridge：bridge橋接器，主要負責 table API和 DataStream/DataSet API的連接支持，按照語言分 java和 scala。

這裏的兩個依賴，是IDE環境下運行需要環境下需要添加的；如果是生產環境， lib目錄下默認已經有了 planner，就只需要有， bridge就可以了。

當然，如果想使用戶自定義函數，或是跟想使用戶自定義函數，或是跟kafka做連接，需需要有一個 SQL client，這個包含在包含在 flink-table-common裏。

1.3 兩種 planner（old & blink）的區別

批流統一： Blink將批處理作業，視爲流式處理的特殊情況。所以，blink不支持表和 DataSet之間的轉換，批處理作業將不轉換爲DataSet應用程序，而是跟流處理一樣，轉換爲DataStream程序來處理。
因爲批流統一, Blink planner也不支持 BatchTableSource，而使用有界的StreamTableSource代替。
Blink planner只支持全新的目錄，不支持已棄用的ExternalCatalog。
舊planner和Blink planner的FilterableTableSource實現不兼容。舊的planner會把PlannerExpressions下推到filterableTableSource中，而blink
planner則會把Expressions下推.
基於字符串的鍵值配置選項僅適用於Blink planner.

6.PlannerConfig在兩個planner中的實現不同。

Blink planner會將多個sink優化在一個DAG中(僅在TableEnvironment上受支持，而在StreamTableEnvironment上不受支持)。而舊planner的優化總是將每一個sink放在一個新的DAG中，其中所有的DAG彼此獨立。
舊的planner不支持目錄統計，而Blink planner支持。

二.Table API和Flink SQL 測試樣例

代碼:

package org.flink.tableapi;

import org.flink.beans.SensorReading;
import org.apache.flink.streaming.api.datastream.DataStream;
import org.apache.flink.streaming.api.datastream.DataStreamSource;
import org.apache.flink.streaming.api.datastream.SingleOutputStreamOperator;
import org.apache.flink.streaming.api.environment.StreamExecutionEnvironment;
import org.apache.flink.table.api.Table;
import org.apache.flink.table.api.java.StreamTableEnvironment;
import org.apache.flink.types.Row;


/**
 * @author 只是甲
 * @date    2021-09-26
 */

public class TableTest1_Example {
    public static void main(String[] args) throws Exception{
        StreamExecutionEnvironment env = StreamExecutionEnvironment.getExecutionEnvironment();
        env.setParallelism(1);

        // 1. 讀取數據
        DataStreamSource<String> inputStream = env.readTextFile("C:\\Users\\Administrator\\IdeaProjects\\FlinkStudy\\src\\main\\resources\\sensor.txt");

        // 2. 轉換成POJO
        DataStream<SensorReading> dataStream = inputStream.map(line -> {
            String[] fields = line.split(",");
            return new SensorReading(fields[0], new Long(fields[1]), new Double(fields[2]));
        });

        // 3. 創建表環境
        StreamTableEnvironment tableEnv = StreamTableEnvironment.create(env);

        // 4. 基於流創建一張表
        Table dataTable = tableEnv.fromDataStream(dataStream);

        // 5. 調用table API進行轉換操作
        Table resultTable = dataTable.select("id, temperature")
                .where("id = 'sensor_1'");

        // 6. 執行SQL
        Table sqlTable = dataTable.select("id, temperature");
        tableEnv.registerTable("sensor", sqlTable);

        // Flink 1.10之後可以生產一個臨時視圖，無需上面那麼麻煩
        // tableEnv.createTemporaryView("sensor", dataTable);

        String sql = "select id, temperature from sensor where id = 'sensor_1'";
        Table resultSqlTable = tableEnv.sqlQuery(sql);

        tableEnv.toAppendStream(resultTable, Row.class).print("result");
        tableEnv.toAppendStream(resultSqlTable, Row.class).print("sql");

        env.execute();
    }
}

測試記錄:

Flink基礎系列29-Table API和Flink SQL之整體介紹一.整體概述二.Table API和Flink SQL 測試樣例參考:

一.整體概述

1.1 什麼是 Table API 和 Flink SQL

1.2 需要引入的pom依賴

1.3 兩種 planner（old & blink）的區別

二.Table API和Flink SQL 測試樣例

參考:

Hudi系列19:Hudi寫入模式一. Changelog 模式二. Append 模式

Hudi系列18:Hudi全量接增量一. 全量接增量概述

Hudi系列15:Hudi元數據同步到Hive 一. hive sync tool工具介紹二. 問題排查三. 實操參考:

Hudi系列13:Hudi集成Hive 一. Hudi集成Hive概述二. Hudi集成Hive步驟三. 實操案例（COW）四. 實操案例（MOR） FAQ: 參考:

Hudi系列14:Hudi元數據持久化一. 元數據持久化二. 實操1(不使用初始化文件) 三. 實操2(使用初始化文件) 參考:

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

Flink基礎系列29-Table API和Flink SQL之整體介紹 一.整體概述 二.Table API和Flink SQL 測試樣例 參考:

一.整體概述

1.1 什麼是 Table API 和 Flink SQL

1.2 需要引入的pom依賴

1.3 兩種 planner（old & blink）的區別

二.Table API和Flink SQL 測試樣例

參考:

Flink基礎系列29-Table API和Flink SQL之整體介紹一.整體概述二.Table API和Flink SQL 測試樣例參考: