flume架構理論

1. Flume是什麼

  • Flume是Cloudera提供的一個高可用的,高可靠的,分佈式的海量日誌採集、聚合和傳輸的系統

  • Flume支持在日誌系統中定製各類數據發送方,用於收集數據;

  • Flume提供對數據進行簡單處理,並寫到各種數據接受方(可定製)的能力。

  • flume支持的多種接入資源數據類型有哪些;多種接出數據類型??

接入:console:終端、RPC網絡、text文本、tail命令、syslog、exec

輸出:磁盤、hdfs、hbase、kafka、網絡傳輸到下游

2. Flume的架構

  • Flume 的核心是把數據從數據源收集過來,再送到目的地。爲了保證輸送一定成功,在送到目的地之前,會先緩存數據,待數據真正到達目的地後,刪除自己緩存的數據。

  • Flume分佈式系統中最核心的角色是agent,flume採集系統就是由一個個agent所連接起來形成。

  • flume使用event對象 來作爲傳遞數據的格式,  是內部傳輸數據的最基本單元

  • 每一個agent相當於一個數據傳遞員,內部有三個組件

    • source

      • 採集組件,用於對接數據源,以獲取數據

    • channel

      • 傳輸通道組件,緩存數據,用於從source將數據傳遞到sink

    • sink

      • 下沉組件,數據發送給最終存儲系統或者下一級agent中

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章