Flume是一個強大的採集日誌信息的工具,它適用大部分的日誌採集場景。它的安裝配置也非常簡單,下面就一起來看看吧!
一、安裝Flume
1、Flume的安裝非常簡單,只需要解壓即可,但是必須先配置hadoop環境,關於hadoop的配置這裏就不多說了。
上傳flume的安裝包然後解壓 tar -zxvf apache-flume-1.6.0-bin.tar.gz
然後進入flume的目錄,修改conf下的flume-env.sh,在裏面配置JAVA_HOME
2、根據數據採集的需求配置採集方案,描述在配置文件中(文件名可任意自定義),根據不同的採集方案設置,配置文件會有一點區別,我們後面再介紹。
3、指定採集方案配置文件,在相應的節點上啓動flume agent
先用一個最簡單的例子來測試一下程序環境是否正常
1、先在flume的conf目錄下新建一個文件
vi netcat-logger.conf
# 定義這個agent中各組件的名字 a1.sources = r1 a1.sinks = k1 a1.channels = c1
# 描述和配置source組件:r1 a1.sources.r1.type = netcat a1.sources.r1.bind = localhost a1.sources.r1.port = 44444
# 描述和配置sink組件:k1 a1.sinks.k1.type = logger
# 描述和配置channel組件,此處使用是內存緩存的方式 a1.channels.c1.type = memory a1.channels.c1.capacity = 1000 a1.channels.c1.transactionCapacity = 100
# 描述和配置source channel sink之間的連接關係 a1.sources.r1.channels = c1 a1.sinks.k1.channel = c1 |
2、啓動agent去採集數據
bin/flume-ng agent -c conf -f conf/netcat-logger.conf -n a1 -Dflume.root.logger=INFO,console |
-c conf 指定flume自身的配置文件所在目錄
-f conf/netcat-logger.con 指定我們所描述的採集方案
-n a1 指定我們這個agent的名字
3、測試
先要往agent採集監聽的端口上發送數據,讓agent有數據可採
隨便在一個能跟agent節點聯網的機器上
telnet anget-hostname port (telnet localhost 44444)