flink實戰--讀寫Hive（Flink on Hive）

原創

2020-06-22 11:42

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦

Flink on Hive 介紹

Apache Flink 從 1.9.0 版本開始增加了與 Hive 集成的功能,1.10.0版本進行了功能的豐富，用戶可以通過 Flink 來訪問 Hive 的元數據，以及讀寫 Hive 中的表,Hive 是大數據領域最早出現的 SQL 引擎，發展至今有着豐富的功能和廣泛的用戶基礎。之後出現的 SQL 引擎，如 Spark SQL、Impala 等，都在一定程度上提供了與 Hive 集成的功能，從而方便用戶使用現有的數據倉庫、進行作業遷移等。

設計架構

與 Hive 集成主要包含了元數據和實際表數據的訪問，因此我們會從這兩方面介紹一下該項目的架構。

1.元數據

爲了訪問外部系統的元數據，Flink 提供了 ExternalCatalog 的概念。但是目前 ExternalCatalog 的定義非常不完整，基本處於不可用的狀態。因此，我們提出了一套全新的 Catalog 接口來取代現有的 ExternalCatalog。新的 Catalog 能夠支持數據庫、表、

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

flink實戰--狀態管理（State TTL、Operator state、Keyed state)

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦簡介 Flink官網的自我介紹：Apache Flink® — Stateful Computations over Data S

2020-06-22 12:51:03

flink實戰--反壓機制與背壓指標計算原理

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦簡介流處理系統必須能優雅地處理反壓（backpressure）問題，因爲實時流處理必然會遇到這樣的場景：短時負載高峯導致系統

2020-06-22 11:42:15

flink實戰--廣播狀態的使用

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦 BroadcastState簡介 Broadcast State 是 Flink 1.5 引入的新特性。在開發過程中，如果遇到需要

2020-06-22 11:42:05

flink實戰--維度join方案在Flink中的實現總結

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦維度join運用場景簡介維度或者是維表是來自數據倉庫維度建模中的概念，區別於事實表業務真實發生的數據，通常用來表示業務屬性，比

2020-06-22 11:42:05

flink實戰--分佈式緩存Distributed Cache

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦簡介 Flink提供了一個分佈式緩存，在flink流處理或者批處理，用戶在並行函數中可以很方便的讀取本地文件，並把它放在taskman

2020-06-22 11:42:04

flink實戰--如何自定義具有Exactly-Once語義的sink（TwoPhaseCommitSinkFunction）

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦 Exactly-Once 語義 exactly-once語義指的是每個輸入的事件隻影響最終結果一次。即使機器或軟件出現故障，既沒有重複

2020-06-22 11:42:04

flink實戰--性能優化

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦優化點一：序列化對於分佈式計算來講，數據的傳輸效率非常重要。好的序列化框架可以通過較低的序列化時間和較低的內存佔用大大提高計

2020-06-22 11:42:04

flink實戰--flink面試題大全

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦目錄第一部分：Flink 中的核心概念和基礎考察一、簡單介紹一下 Flink

2020-06-22 11:42:04

flink實戰--數據寫入clickhouse

簡介 Clickhouse 支持http協議的web方式進行訪問，也支持JDBC或者ODBC的驅動程序的客戶端進行訪問，我們使用Flink操作Clickhouse,可以按照操作mysql一樣的方式通過JDBC進行訪

2020-06-22 11:42:04

flink實戰--累加器（accumulator）如何使用

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦簡介 Flink的Accumulators(累加器)相比spark的累加器，使用起來是非常簡單的。通過一個add操作累加最終的結果，在

2020-06-22 11:42:04

PyFlink實戰--PyFlink安裝與入門介紹

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦簡介 PyFlink 是什麼？簡單點說就是 Flink + Python，也就是 Flink on Python，

2020-06-22 11:42:04

flink實戰--flink讀取hdfs目錄下多個文件（遞歸、正則匹配）

2020-06-02 17:00:47

flink實戰--實戰案例

2020-06-02 17:00:47

flink實戰--flink原理解析

2020-06-02 17:00:47

flink實戰--水印（watermark）終極總結

2020-06-02 17:00:47

24小時熱門文章

最新文章

最新評論文章