1. JDK的安裝

參考jdk的安裝，此處略。

2. 安裝Zookeeper

參考我的Zookeeper安裝教程中的“完全分佈式”部分。

3. 安裝Kafka

參考我的Kafka安裝教程中的“完全分佈式搭建”部分。

4. 安裝Flume

參考我的Flume安裝教程。

5. 配置Flume

5.1. 配置 kafka-s.cfg

$ cd /software/flume/conf/ #切換到kafka的配置文件目錄

$ cp flume-conf.properties.template kafka-s.cfg #將flume的配置文件模板複製爲kafka-s.cfg

kafka-s.cfg的詳細內容如下：

#配置flume agent的source、channel、sink

a1.sources = r1

a1.channels = c1

a1.sinks=k1

#配置source

a1.sources.r1.type = exec

a1.sources.r1.command=tail -F/tmp/logs/kafka.log

# 配置channel

a1.channels.c1.type = memory

a1.channels.c1.capacity = 1000

a1.channels.c1.transactionCapacity = 100

#配置sink

a1.sinks.k1.channel = c1

a1.sinks.k1.type =org.apache.flume.sink.kafka.KafkaSink

#設置Kafka的Topic

a1.sinks.k1.kafka.topic = mytest

#設置Kafka的broker地址和端口號

a1.sinks.k1.kafka.bootstrap.servers = s201:9092,s202:9092,s203:9092

#配置批量提交的數量

a1.sinks.k1.kafka.flumeBatchSize = 20

a1.sinks.k1.kafka.producer.acks = 1

a1.sinks.k1.kafka.producer.linger.ms = 1

a1.sinks.ki.kafka.producer.compression.type= snappy

# 綁定source和sink 到channel

a1.sources.r1.channels = c1

a1.sinks.k1.channel=c1

關於上面配置文件中需要注意的3點：

a、a1.sources.r1.command=tail-F /tmp/logs/kafka.log

b、a1.sinks.k1.kafka.bootstrap.servers= s201:9092,s202:9092,s203:9092

c、a1.sinks.k1.topic= mytest

由配置文件我們可以瞭解到：

1）、我們需要在/tmp/logs下建一個kafka.log的文件，且向文件中輸出內容（下面會說到）；

2）、flume連接到kafka的地址是 s201:9092,s202:9092,s203:9092，注意不要配置錯誤了；

3）、flume會將採集後的內容輸出到Kafkatopic 爲mytest上，所以我們啓動zk，kafka後需要打開一個終端消費topic mytest的內容，這樣就可以看到flume與kafka之間玩起來了。

5.2. 創建/tmp/logs/kafka.log文件目錄及文件

在/tmp/logs下建立空文件kafka.log；如果/tmp目錄下沒有logs目錄，則需要先創建logs目錄。

5.3. 創建生成日誌數據shell腳本

在hadoop用戶目錄下創建kafkaoutput.sh腳本，並賦予執行權限，用來向/tmp/logs/kafka.log輸出內容。

kafkaoutput.sh腳本的具體內容如下：

for((i=0;i<=1000;i++));

do echo"kafka_test-"+$i>>/tmp/logs/kafka.log;

done

5.4. 啓動Zookeeper

到zk安裝的服務器上啓動zk服務，命令如下：

$ zkServer.sh start

5.5. 啓動Kafka

到部署kafka每臺服務器上面啓動kafka集羣

$ kafka-server-start.sh/software/kafka/config/server.properties &

5.6. 創建Kafka Topic

$ kafka-topics.sh --create --zookeeper s201:2181--replication-factor 3 --partitions 3 --topic mytest

5.7. 啓動消費Topic

$ kafka-console-consumer.sh--bootstrap-server s201:9092,s202:9092,s203:9092 --zookeepers201:2181,s202:2181,s203:2181 --topic mytest --from-beginning

5.8. 啓動Flume

$ flume-ng agent --conf/software/flume/conf/ --conf-file kafka-s.cfg --name a1-Dflume.root.logger=INFO,console

5.9. 執行kafkaoutput.sh腳本生成日誌數據

$ ./kafkaoutput.sh

查看日誌文件內容如下：

在kafka中查看的消費信息：

Flume+Kafka+Zookeeper搭建大數據日誌採集框架

1. JDK的安裝

2. 安裝Zookeeper

3. 安裝Kafka

4. 安裝Flume

5. 配置Flume

5.1. 配置 kafka-s.cfg

5.2. 創建/tmp/logs/kafka.log文件目錄及文件

5.3. 創建生成日誌數據shell腳本

5.4. 啓動Zookeeper

5.5. 啓動Kafka

5.6. 創建Kafka Topic

5.7. 啓動消費Topic

5.8. 啓動Flume

5.9. 執行kafkaoutput.sh腳本生成日誌數據

linux安裝cuda和cudnn

Mellanox網卡開啓SR-IOV

模擬手機設備：使用 Playwright 實現移動端自動化測試

全面系統的AI學習路徑，幫助普通人也能玩轉AI

HTML 00 Tutorial

uni-app實現上拉加載

vue3編譯優化之“靜態提升”

又是一個月-20240513

flask 如何保證返回json有序

linux服務器設置ssh免密

Hive2.1.1安裝

Kafka安裝部署

Hadoop機架感知

我的友情鏈接

Centos7安裝Python2.7

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結

Flume+Kafka+Zookeeper搭建大數據日誌採集框架

1. JDK的安裝

2. 安裝Zookeeper

3. 安裝Kafka

4. 安裝Flume

5. 配置Flume

5.1. 配置kafka-s.cfg

5.2. 創建/tmp/logs/kafka.log文件目錄及文件

5.3. 創建生成日誌數據shell腳本

5.4. 啓動Zookeeper

5.5. 啓動Kafka

5.6. 創建Kafka Topic

5.7. 啓動消費Topic

5.8. 啓動Flume

5.9. 執行kafkaoutput.sh腳本生成日誌數據

5.1. 配置 kafka-s.cfg