flink实战--读写Hive（Flink on Hive）

原創

2020-06-22 11:42

扫一扫加入大数据公众号和技术交流群，了解更多大数据技术，还有免费资料等你哦

Flink on Hive 介绍

Apache Flink 从 1.9.0 版本开始增加了与 Hive 集成的功能,1.10.0版本进行了功能的丰富，用户可以通过 Flink 来访问 Hive 的元数据，以及读写 Hive 中的表,Hive 是大数据领域最早出现的 SQL 引擎，发展至今有着丰富的功能和广泛的用户基础。之后出现的 SQL 引擎，如 Spark SQL、Impala 等，都在一定程度上提供了与 Hive 集成的功能，从而方便用户使用现有的数据仓库、进行作业迁移等。

设计架构

与 Hive 集成主要包含了元数据和实际表数据的访问，因此我们会从这两方面介绍一下该项目的架构。

1.元数据

为了访问外部系统的元数据，Flink 提供了 ExternalCatalog 的概念。但是目前 ExternalCatalog 的定义非常不完整，基本处于不可用的状态。因此，我们提出了一套全新的 Catalog 接口来取代现有的 ExternalCatalog。新的 Catalog 能够支持数据库、表、

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

flink实战--状态管理（State TTL、Operator state、Keyed state)

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦簡介 Flink官網的自我介紹：Apache Flink® — Stateful Computations over Data S

2020-06-22 12:51:03

flink实战--反压机制与背压指标计算原理

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦簡介流處理系統必須能優雅地處理反壓（backpressure）問題，因爲實時流處理必然會遇到這樣的場景：短時負載高峯導致系統

2020-06-22 11:42:15

flink实战--广播状态的使用

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦 BroadcastState簡介 Broadcast State 是 Flink 1.5 引入的新特性。在開發過程中，如果遇到需要

2020-06-22 11:42:05

flink实战--维度join方案在Flink中的实现总结

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦維度join運用場景簡介維度或者是維表是來自數據倉庫維度建模中的概念，區別於事實表業務真實發生的數據，通常用來表示業務屬性，比

2020-06-22 11:42:05

flink实战--分布式缓存Distributed Cache

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦簡介 Flink提供了一個分佈式緩存，在flink流處理或者批處理，用戶在並行函數中可以很方便的讀取本地文件，並把它放在taskman

2020-06-22 11:42:04

flink实战--如何自定义具有Exactly-Once语义的sink（TwoPhaseCommitSinkFunction）

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦 Exactly-Once 語義 exactly-once語義指的是每個輸入的事件隻影響最終結果一次。即使機器或軟件出現故障，既沒有重複

2020-06-22 11:42:04

flink实战--性能优化

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦優化點一：序列化對於分佈式計算來講，數據的傳輸效率非常重要。好的序列化框架可以通過較低的序列化時間和較低的內存佔用大大提高計

2020-06-22 11:42:04

flink实战--flink面试题大全

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦目錄第一部分：Flink 中的核心概念和基礎考察一、簡單介紹一下 Flink

2020-06-22 11:42:04

flink实战--数据写入clickhouse

簡介 Clickhouse 支持http協議的web方式進行訪問，也支持JDBC或者ODBC的驅動程序的客戶端進行訪問，我們使用Flink操作Clickhouse,可以按照操作mysql一樣的方式通過JDBC進行訪

2020-06-22 11:42:04

flink实战--累加器（accumulator）如何使用

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦簡介 Flink的Accumulators(累加器)相比spark的累加器，使用起來是非常簡單的。通過一個add操作累加最終的結果，在

2020-06-22 11:42:04

PyFlink实战--PyFlink安装与入门介绍

掃一掃加入大數據公衆號和技術交流羣，瞭解更多大數據技術，還有免費資料等你哦簡介 PyFlink 是什麼？簡單點說就是 Flink + Python，也就是 Flink on Python，

2020-06-22 11:42:04

flink实战--flink读取hdfs目录下多个文件（递归、正则匹配）

2020-06-02 17:00:47

flink实战--实战案例

2020-06-02 17:00:47

flink实战--flink原理解析

2020-06-02 17:00:47

flink实战--水印（watermark）终极总结

2020-06-02 17:00:47

24小時熱門文章

最新文章

最新評論文章