新一代流式計算平臺Apache Heron專題【更新】

聲明:均爲原創文章,轉載請註明出處!

Heron相關基礎概念

本地及集羣環境搭建

Heron單節點環境爲單機環境中的配置過程,高可用集羣環境配置使用了Aurora+Mesos+Zookeeper+HDFS的真實可用的Heron流式計算環境。

基礎過程

整體搭建過程

部分詳細內容

高可用節點中將Heron配置在了Apache Mesos中配合Aurora進行運行。Heron使用Zookeeper作爲State Manager,這裏爲Zookeeper多節點集羣的搭建方式,用於在大規模集羣中使用,也可以簡化爲一個zookeeper節點部署在Master主機中。Heron使用了Aurora Scheduler作爲任務調度器,這裏的重點問題是,如何將aurora和mesos集羣進行集成,以正常使用aurora-scheduler。同時,這裏作爲heron的調度器,也是之後研究的內容。此外,Heron使用HDFS作爲Uploader,因此,需要在集羣中的各個節點上安裝配置HDFS環境。

集羣擴充配置

集羣部署及更改記錄(個人)

集羣運行詳情

Heron in IntelliJ IDEA

基礎過程及嘗試

Heron-get-start Project

這裏使用IntelliJ IDEA作爲Heron拓撲的開發IDE,並提供一個簡單的開始項目,介紹如何使用Heron編寫自己的流式作業拓撲並提交至Heron中運行。

Topology運行調試

集羣運行命令總結

資源監測與可視化

Streaming Benchmark for Heron

部署基礎過程:

流式計算組件集成:

調度機制及任務分配算法解析

  • Heron調度機制源碼解析(待完成)
  • RoundRobin Packing Algorithm解析
  • RoundRobin Comparison Algorithm解析
  • First Fit Decreasing Packing Algorithm解析

學術論文資源

Heron相關原始論文:

  • Twitter Heron: Stream Processing at Scale
  • Streaming@Twitter
  • Twitter Heron: Towards Extensible Streaming Engines

我的論文:

異常及問題記錄

1. 集羣環境搭建

Stack Overflow相關問題及解答:

2. 拓撲提交運行

3. Heron streaming benchmark

主要參考資料

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章