原创 flink實戰--狀態管理(State TTL、Operator state、Keyed state)

掃一掃加入大數據公衆號和技術交流羣,瞭解更多大數據技術,還有免費資料等你哦 簡介              Flink官網的自我介紹:Apache Flink® — Stateful Computations over Data S

原创 java實戰--JVM終極總結

 CPU和內存的交互 瞭解jvm內存模型前,瞭解下cpu和計算機內存的交互情況。【因爲Java虛擬機內存模型定義的訪問操作與計算機十分相似】有篇很棒的文章,從cpu講到內存模型:什麼是java內存模型在計算機中,cpu和內存的交互最爲頻繁

原创 flink實戰--反壓機制與背壓指標計算原理

掃一掃加入大數據公衆號和技術交流羣,瞭解更多大數據技術,還有免費資料等你哦 簡介                流處理系統必須能優雅地處理反壓(backpressure)問題,因爲實時流處理必然會遇到這樣的場景:短時負載高峯導致系統

原创 flink實戰--廣播狀態的使用

掃一掃加入大數據公衆號和技術交流羣,瞭解更多大數據技術,還有免費資料等你哦 BroadcastState簡介              Broadcast State 是 Flink 1.5 引入的新特性。在開發過程中,如果遇到需要

原创 flink實戰--維度join方案在Flink中的實現總結

掃一掃加入大數據公衆號和技術交流羣,瞭解更多大數據技術,還有免費資料等你哦 維度join運用場景簡介               維度或者是維表是來自數據倉庫維度建模中的概念,區別於事實表業務真實發生的數據,通常用來表示業務屬性,比

原创 java實戰--GC終極總結

GC簡介 java的最大好處是自動垃圾回收,這樣就無需我們手動的釋放對象空間了,但是也產生了相應的負效果,gc是需要時間和資源的,不好的gc會嚴重影響系統的系能,因此良好的gc是JVM的高性能的保證。JVM堆分爲新生代,舊生代和年老代,

原创 flink實戰--分佈式緩存Distributed Cache

掃一掃加入大數據公衆號和技術交流羣,瞭解更多大數據技術,還有免費資料等你哦 簡介            Flink提供了一個分佈式緩存,在flink流處理或者批處理,用戶在並行函數中可以很方便的讀取本地文件,並把它放在taskman

原创 flink實戰--如何自定義具有Exactly-Once語義的sink(TwoPhaseCommitSinkFunction)

掃一掃加入大數據公衆號和技術交流羣,瞭解更多大數據技術,還有免費資料等你哦 Exactly-Once 語義            exactly-once語義指的是每個輸入的事件隻影響最終結果一次。即使機器或軟件出現故障,既沒有重複

原创 flink實戰--性能優化

掃一掃加入大數據公衆號和技術交流羣,瞭解更多大數據技術,還有免費資料等你哦 優化點一:序列化            對於分佈式計算來講,數據的傳輸效率非常重要。好的序列化框架可以通過較低    的序列化時間和較低的內存佔用大大提高計

原创 flink實戰--讀寫Hive(Flink on Hive)

掃一掃加入大數據公衆號和技術交流羣,瞭解更多大數據技術,還有免費資料等你哦 Flink on Hive 介紹                           Apache Flink 從 1.9.0 版本開始增加了與 Hive

原创 flink實戰--flink面試題大全

掃一掃加入大數據公衆號和技術交流羣,瞭解更多大數據技術,還有免費資料等你哦 目錄 第一部分:Flink 中的核心概念和基礎考察 一、 簡單介紹一下 Flink

原创 clickhouse實戰--clickhouse安裝與使用

掃一掃加入大數據公衆號和技術交流羣,瞭解更多大數據技術,還有免費資料等你哦 Clickhouse安裝方式 單機安裝 容器安裝 集羣安裝 建議:測試與學習時,使用容器安裝方便上手與學習 Ubuntu/Debian安裝 sudo

原创 flink實戰--數據寫入clickhouse

簡介             Clickhouse 支持http協議的web方式進行訪問,也支持JDBC或者ODBC的驅動程序的客戶端進行訪問,我們使用Flink操作Clickhouse,可以按照操作mysql一樣的方式通過JDBC進行訪

原创 flink實戰--累加器(accumulator)如何使用

掃一掃加入大數據公衆號和技術交流羣,瞭解更多大數據技術,還有免費資料等你哦 簡介            Flink的Accumulators(累加器)相比spark的累加器,使用起來是非常簡單的。通過一個add操作累加最終的結果,在

原创 PyFlink實戰--PyFlink安裝與入門介紹

掃一掃加入大數據公衆號和技術交流羣,瞭解更多大數據技術,還有免費資料等你哦 簡介                      PyFlink 是什麼?簡單點說就是 Flink + Python,也就是 Flink on Python,