Flume個人心得筆記之Sink安裝

原創

萌新Java程序猿

2019-07-06 17:26

Flume個人心得筆記之Sink安裝

目錄

Flume個人心得筆記之Sink安裝

一.Logger Sink

二、可配置項說明

二.File_roll Sink

二、可配置選項說明

3.啓動指令啓動不了，殺死對應進程重新啓動

4.編輯文件如果誤操作，可以按照Ctrl +Backspace 回退

二、可配置選項說明

1.備份一份文件

4.確保HDFS啓動

四、存在問題

1.報錯是因爲flume缺少相關hadoop的依賴jar包，

2.但是一個一個找特別麻煩，所以解決辦法是將hadoop的jar包都拷貝到flume的lib目錄下：

二、可配置選項說明

三、多級流動

3.第一個雲主機配置

4.第二個雲主機配置

5.第三個雲主機配置

6.啓動第三個節點往後向前啓動

四、扇出流

2.第一個和第二個配置相同

3.第三個節點

4.啓動從最後一個啓動

一.Logger Sink

一、概述

記錄指定級別（比如INFO，DEBUG，ERROR等）的日誌，通常用於調試
要求，在 --conf（-c )參數指定的目錄下有log4j的配置文件
根據設計，logger sink將body內容限制爲16字節，從而避免屏幕充斥着過多的內容。如果想要查看調試的完整內容，那麼你應該使用其他的sink，也許可以使用file_roll sink，它會將日誌寫到本地文件系統中

二、可配置項說明

配置項	說明
channel	綁定通道
type	logger

三、示例

默認配置，就不演示了

https://blog.csdn.net/LiuY521/article/details/94721238

二.File_roll Sink

一、概述

在本地系統中存儲事件
每隔指定時長生成文件保存這段時間內收集到的日誌信息

二、可配置選項說明

配置項	說明
channel	綁定通道
type	file_roll
sink.directory	文件被存儲的目錄
sink.rollInterval	30 記錄日誌到文件裏，每隔30秒生成一個新日誌文件。如果設置爲0，則禁止滾動，從而導致所有數據被寫入到一個文件中。

三、示例

1.複製文本

mv basic2.conf filerollsink.txt

2.編輯配置

3.啓動指令啓動不了，殺死對應進程重新啓動

4.編輯文件如果誤操作，可以按照Ctrl +Backspace 回退

5.查詢數據

三.HDFS Sink

一、概述

此Sink將事件寫入到Hadoop分佈式文件系統HDFS中
目前它支持創建文本文件和序列化文件，並且對這兩種格式都支持壓縮
這些文件可以分卷，按照指定的時間或數據量或事件的數量爲基礎
它還通過類似時間戳或機器屬性對數據進行 buckets/partitions 操作
HDFS的目錄路徑可以包含將要由HDFS替換格式的轉移序列用以生成存儲事件的目錄/文件名
使用這個Sink要求haddop必須已經安裝好，以便Flume可以通過hadoop提供的jar包與HDFS進行通信

二、可配置選項說明

配置項	說明
channel	綁定的通道
type	hdfs
hdfs.path	HDFS 目錄路徑（hdfs://namenode/flume/webdata/)
hdfs.inUseSuffix	.tmp Flume正在處理的文件所加的後綴
hdfs.rollInterval	文件生成的間隔事件，默認是30，單位是秒
hdfs.rollSize	生成的文件大小，默認是1024個字節，0表示不開啓此項
hdfs.rollCount	每寫幾條數據就生成一個新文件，默認數量爲10 每寫幾條數據就生成一個新文件，
hdfs.fileType	SequenceFile/DataStream/CompressedStream
hdfs.retryInterval	80 Time in seconds between consecutive attempts to close a file. Each close call costs multiple RPC round-trips to the Namenode, so setting this too low can cause a lot of load on the name node. If set to 0 or less, the sink will not attempt to close the file if the first attempt fails, and may leave the file open or with a ”.tmp” extension.

三、示例

1.備份一份文件

vim HDFS.conf

2.編輯配置

3.啓動

4.確保HDFS啓動

5.傳輸數據

報錯格式不支持

配置寫錯了

6.查詢

四、存在問題

1.報錯是因爲flume缺少相關hadoop的依賴jar包，

找到以下的jar包，放到flume的lib目錄下即可。

commons-configuration-1.6.jar
hadoop-auth-2.5.2.jar
hadoop-common-2.5.2.jar
hadoop-hdfs-2.5.2.jar
hadoop-mapreduce-client-core-2.5.2.jar

2.但是一個一個找特別麻煩，所以解決辦法是將hadoop的jar包都拷貝到flume的lib目錄下：

執行：
scp common/*
common/lib/*
hdfs/*
hdfs/lib/*
mapreduce/*
mapreduce/lib/*
tools/lib/*
10.42.60.249:/home/software/flume/lib/

四.Avro Sink

一、概述

將源數據進行利用avro進行序列化之後寫到指定的節點上
是實現多級流動、扇出流(1到多) 扇入流(多到1) 的基礎

二、可配置選項說明

配置項	說明
channel	綁定的通道
type	avro
hostname	要發送的主機
port	要發往的端口號

三、多級流動

1.概述

讓01機的flume通過netcat source源接收數據，然後通過avro sink 發給02機
02機的flume利用avro source源收數據，然後通過avro sink 傳給03機
03機通過avro source源收數據，通過logger sink 輸出到控制檯上

2.實現步驟

準備三個節點，並安裝好flume（關閉每臺機器的防火牆）
配置每臺flume的配置文件

3.第一個雲主機配置

4.第二個雲主機配置

5.第三個雲主機配置

6.啓動第三個節點往後向前啓動

7.輸入數據

8.接收數據

四、扇出流

1.編輯文件

vim shanru.conf

2.第一個和第二個配置相同

3.第三個節點

4.啓動從最後一個啓動

../bin/flume-ng agent -n a1 -c ../conf -f 要啓動的文件 -Dflume.root.logger=INFO,console

5.發送數據

6.接收數據

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

(開源) 寫了一個無代碼平臺 brick

前沿無代碼開發是一種無需編寫代碼或通過少量代碼就可以快速生成應用程序的開發平臺。它可以快速交付應用程序，解決傳統軟件開發模式帶來的週期長、成本高等問題。無代碼開發平臺，允許用戶通過拖拽和放置組件的方式來構建應用界面。 brick 是一個

快樂的開發者

2024-05-24 14:33:07

2023 年上半年數據庫系統工程師考試

基礎知識 ● 計算機中，系統總線用於（1）。（1）A.接口和外設 B.運算器、控制器和寄存器 C.CPU、主存及外設部件 D.DMA 控制器和中斷控制器參考答案：（1）C 系統

2024-05-24 14:25:06

5 月，Java 崗位爆了？？？

大家好，我是R哥。最近，R哥分享了兩個特別有意思的面試輔導成功案例： 35K*14 薪入職了，這公司只要不裁員，我能一直呆下去。。幹了 2 年多 Java 外包，終於脫離了！今天再分享一個振奮人心的面試輔導 case：

2024-05-24 14:22:06

PhiData 一款開發AI搜索、agents智能體和工作流應用的AI框架

引言在人工智能領域，構建一個能夠理解並響應用戶需求的智能助手是一項挑戰性的任務。PhiData作爲一個開源框架，爲開發者提供了構建具有長期記憶、豐富知識和強大工具的AI助手的可能性。本文將介紹PhiData的核心優勢、應用示例以及如何使用

2024-05-24 14:19:55

你們線上突發OOM，是如何快速定位OOM問題？

當我們的請求進來，需要創建對象，那就需要去內存中申請空間，這時候如果內存滿了就會觸發FullGC,GC之後如果內存依然爆滿，這時候就會出現 OutOfMemeryError的異常。那如果說OOM我們的應用會掛掉嗎？其實不一定，如果某些請求

2024-05-24 14:16:15

一個註解搞定 SpringBoot 接口防刷

說明：使用了註解的方式進行對接口防刷的功能，非常高大上，本文章僅供參考一，技術要點：springboot的基本知識，redis基本操作，首先是寫一個註解類： import java.lang.annotation.Retention;i

2024-05-24 14:15:35

《最新出爐》系列入門篇-Python+Playwright自動化測試-47-自動滾動到元素出現的位置

1.簡介在我們日常工作中或者生活中，經常會遇到我們的頁面內容較多，一個屏幕範圍無法完整展示內容，我們就需要滾動滾動條去到我們想要的地方，如下圖頁面，我們雖然在豆瓣首頁，但是內容並不完整，如果我們想要直接點擊電影模塊中的選電影按鈕，是需要往

2024-05-24 14:15:25

cdn302跳轉

2024-05-24 14:14:35

刪除一個IP

刪除下面的172.16.15.102 IP eth0: <BROADCAST,MULTICAST,UP,LOWER_UP> mtu 1500 qdisc fq state UP qlen 1000 link/ether fa:

2024-05-24 14:14:35

$ git push -u origin "master" [rejected]

$ git push -u origin "master"To https://gitee.com/ee/0523.git ! [rejected] master -> master (non-fast-forward)err

2024-05-24 14:11:14

How do I read Japanese characters from a PDF?

How do I read Japanese characters from a PDF? Encoding CMaps in particular for CJK scripts are in a separate package.

2024-05-24 14:07:54

k8s運維面試題【轉】

常見的k8s運維面試題 1、簡述ETCD及其特點? etcd是一個用於配置共享和服務發現的鍵值存儲系統，能夠爲整個分佈式集羣存儲關鍵數據，協助集羣正常運轉服務端將配置信息存儲在etcd中，客戶端從etcd中得到配置信息，etcd監聽配置信

2024-05-24 14:05:53

使用interface化解一場因操作系統不同導致的編譯問題

場景描述起因：因項目需求，需要編寫一個agent, 需支持Linux和Windows操作系統。 Agent裏面有一個功能需要獲取到服務器上所有已經被佔用的端口。實現方式：針對不同的操作系統，實現方式有所不同 linux: 使用服務

2024-05-24 14:00:23

Nginx R31 doc-09-Serving Static Content 靜態內容

提供靜態內容配置 NGINX 和 NGINX Plus 以提供靜態內容，使用類型特定的根目錄，檢查文件存在性，並進行性能優化。本節介紹如何配置 NGINX 和 NGINX Plus 以提供靜態內容，如何定義搜索請求文件的路徑，如何設置索

2024-05-24 14:00:23

3326：練55.1 合影效果

【題目描述】小明和朋友們去爬香山，爲美麗的景色所陶醉，想合影留念。如果他們站成一排，男生全部在左（從拍照者的角度），並按照從矮到高的順序從左到右排，女生全部在右，並按照從高到矮的順序從左到右排，請問他們合影的效果是什麼樣的（所有人的身高都

2024-05-24 14:00:12

24小時熱門文章

最新文章

最新評論文章