1. Flume是什麼
-
Flume是Cloudera提供的一個高可用的,高可靠的,分佈式的海量日誌採集、聚合和傳輸的系統
-
Flume支持在日誌系統中定製各類數據發送方,用於收集數據;
-
Flume提供對數據進行簡單處理,並寫到各種數據接受方(可定製)的能力。
-
flume支持的多種接入資源數據類型有哪些;多種接出數據類型??
接入:console:終端、RPC網絡、text文本、tail命令、syslog、exec
輸出:磁盤、hdfs、hbase、kafka、網絡傳輸到下游
2. Flume的架構
-
Flume 的核心是把數據從數據源收集過來,再送到目的地。爲了保證輸送一定成功,在送到目的地之前,會先緩存數據,待數據真正到達目的地後,刪除自己緩存的數據。
-
Flume分佈式系統中最核心的角色是agent,flume採集系統就是由一個個agent所連接起來形成。
-
flume使用event對象 來作爲傳遞數據的格式, 是內部傳輸數據的最基本單元
-
每一個agent相當於一個數據傳遞員,內部有三個組件
-
source
-
採集組件,用於對接數據源,以獲取數據
-
-
channel
-
傳輸通道組件,緩存數據,用於從source將數據傳遞到sink
-
-
sink
-
下沉組件,數據發送給最終存儲系統或者下一級agent中
-
-