速點鏈接加入高手戰隊:http://www.dajiangtai.com/course/112.do
Wormhole是什麼
Wormhole 面向大數據流式處理項目的開發管理運維人員,致力於提供統一抽象的概念體系,直觀可視化的操作界面,簡單流暢的配置管理流程,基於 SQL 即可完成的業務邏輯開發方式,並且屏蔽了流式處理的底層技術細節,極大的降低了數據項目管理運維門檻,使得大數據流式處理項目的開發管理運維變得更加輕量敏捷可控可靠。
Wormhole由宜信開源,能夠非常方便的與DBus整合,作爲DBus的下游分發系統或者流處理系統來使用,以下是架構圖
爲什麼會有Wormhole
在小公司,我們往往全部定製各種job來解決流處理或者批處理問題,例如全部自己寫MR,Flink app,Spark app。隨着公司規模的擴大,業務範圍不斷拓展,數據需求不斷增加,有兩個問題擺在我們面前:
(1)全部定製流處理、批處理程序成本太高且不便於管理
(2)很多流處理,批處理程序可以被抽象爲標準的模板,通過改變參數來服用,可以節約大量開發資源,便於統一管控
在整個大背景下,Wormhole產生了,他的產生和Hive產生爲了解決寫複雜MR的初衷是一致的,只不過它是更加上層的抽象。
Wormhole主要特性
支持可視化,配置化,SQL 化開發實施流式項目
支持指令式動態流式處理的管理,運維,診斷和監控
支持統一結構化 UMS 消息和自定義半結構化 JSON 消息
支持處理增刪改三態事件消息流
支持單個物理流同時並行處理多個邏輯業務流
支持流上 Lookup Anywhere,Pushdown Anywhere
支持基於業務策略的事件時間戳流式處理
支持 UDF 的註冊管理和動態加載
支持多目標數據系統的併發冪等入庫
支持多級基於增量消息的數據質量管理
支持基於增量消息的流式處理和批量處理
支持 Lambda 架構和 Kappa 架構
支持與三方系統無縫集成,可作爲三方系統的流控引擎
支持私有云部署,安全權限管控和多租戶資源管理