Flume

原創

2018-09-30 12:29

一、概述

官網

http://flume.apache.org/FlumeUserGuide.html#hdfs-sink

Cloudera 公司開發的實時的日誌採集-> 捐獻給了apache

適用於實時的數據分析（spark）

同樣也可以用於離線的分析 (hive)

Flume is a distributed, reliable, and available service for efficiently collecting, aggregating, and moving large amounts of log data. It has a simple and flexible architecture based on streaming data flows. It is robust and fault tolerant with tunable reliability mechanisms and many failover and recovery mechanisms. It uses a simple extensible data model that allows for online analytic application.

Flume 是一個分佈式的，高可用的是一個收集聚集移動（流式處理）日誌收集系統
Flume 僅僅運行在unix環境下(linux)

Flume 只有一個角色 Agent 該角色下存在:

Source 用於採集數據的組件,在source裏產生數據流，同時會把數據流傳輸給Channel
Channel 主要是連接source 和sink的組件有點類似於隊列
Sink 從channel收集數據,將數據寫到目標源可以將目標源設置爲HDFS 目錄

在flume中傳輸的最小單元爲event, source將數據封裝到evnet裏 sink拿到event

Event組件

本身就是一個字節數組

Header 頭信息 key value

Body 主體： 字節數組存儲數據的詳細內容

一個行文本的內容就會被序列化爲一個event
Event 的最大字節爲2048
超過了大小，會進行切割存放到下個event
Event的默認編碼爲UTF-8

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

容器運行時Containerd

sudo ctr image import image.tar #導入docker鏡像 sudo ctr image list #顯示鏡像列表 sudo ctr containers list #列出容器列表

2024-05-12 14:32:51

Shopify Theme 開發 —— 性能優化

一、概述關於 Shopify Theme 的性能優化，通常有以下幾點： 1、卸載未使用的應用程序有些 app 會在 theme 裏面插入一些代碼，即使 app 未被使用，也可能會加載一些腳本文件，影響頁面渲染速度，所以建議不使用的 ap

2024-05-12 14:28:51

爬蟲selenium解決網頁空白問題

from selenium.webdriver import Chrome import time # https://blog.csdn.net/zhoukeguai/article/details/113247342 # driver

張博的博客

2024-05-12 14:25:11

接口請求軟件, 後端必備

apifox, 完全免費軟件, 比postman好用, 性能高, 推薦給每一個童鞋.

張博的博客

2024-05-12 14:25:11

Python 潮流週刊#50：我最喜歡的 Python 3.13 新特性！

本週刊由 Python貓出品，精心篩選國內外的 250+ 信息源，爲你挑選最值得分享的文章、教程、開源項目、軟件工具、播客和視頻、熱門話題等內容。願景：幫助所有讀者精進 Python 技術，並增長職業和副業的收入。本期分享了 12 篇文

豌豆花下貓

2024-05-12 14:24:30

vue綁定對象，綁定的值不改變的問題

在使用vue結合elmentui的table組件，對數組綁定，需要編輯數組裏一些屬性的值。我的情況是，需要在打開這個表時，根據條件插入一些對象到table裏，經測試，到這裏是沒問題的，可以顯示新插入的對象。問題在於，當我改變這些新插入對象的

2024-05-12 14:22:30

PLY文件格式及cpp解析

PLY (Polygon File Format, 多邊形文件格式)文件用於存儲Geometry Object Data(包括vertices, face and other element頂點/面片/其它屬性) 文件格式： Header

2024-05-12 14:18:50

UBUNTU無法上網的解決

一.網絡圖標不見的應對方法1、刪除NetworkManager緩存文件service NetworkManager stop rm /var/lib/NetworkManager/NetworkManager.state service N

2024-05-12 14:18:40

前端使用 Konva 實現可視化設計器（10）- 對齊線

請大家動動小手，給我一個免費的 Star 吧~ 大家如果發現了 Bug，歡迎來提 Issue 喲~ github源碼 gitee源碼示例地址不知不覺來到第 10 章了，感覺接近尾聲了。。。對齊線先看效果：這裏交互有兩個部分：

2024-05-12 14:13:19

AFL漏洞挖掘技術漫談（一）：用AFL開始你的第一次Fuzzing

https://www.freebuf.com/articles/system/191543.html 一、前言模糊測試（Fuzzing）技術作爲漏洞挖掘最有效的手段之一，近年來一直是衆多安全研究人員發現漏洞的首選技術。AFL、LibFu

2024-05-12 14:11:19

使用c#強大的表達式樹實現對象的深克隆

一、表達式樹的基本概念表達式樹是一個以樹狀結構表示的表達式，其中每個節點都代表表達式的一部分。例如，一個算術表達式 a + b 可以被表示爲一個樹，其中根節點是加法運算符，它的兩個子節點分別是 a 和 b。在 LINQ（語言集成查詢）中，

2024-05-12 14:10:39

SQL SERVER 數據庫清空語句忽略外鍵觸發器等（轉載）

有時候我們想清空SQL Server中所有表的數據，但是由於有外鍵約束和觸發器，有時候清表語句無法執行，下面的語句可以關掉和開啓一個數據庫中的所有外鍵約束和觸發器，以便執行清表語句： USE ClothesShop EXECUTE sp

2024-05-12 14:08:28

從零手寫實現 tomcat-11-filter 過濾器

創作緣由平時使用 tomcat 等 web 服務器不可謂不多，但是一直一知半解。於是想着自己實現一個簡單版本，學習一下 tomcat 的精髓。系列教程從零手寫實現 apache Tomcat-01-入門介紹從零手寫實現 apach

2024-05-12 14:04:58

Java開發利器Commons Lang之元組Tuple

標準Java庫沒有提供足夠的方法來操作其核心類，Apache Commons Lang提供了這些額外的方法。 Apache Commons Lang爲java提供了大量的幫助工具。lang API，特別是String操作方法、基本數值

2024-05-12 14:03:48

詐騙（殺豬盤）網站進行滲透測試

今天朋友突然告訴我，某轉買手機被騙了1200塊錢，心理一驚，果然不出所料，那我來試試吧。要來了詐騙網站地址，打開是這種：果斷收集一下信息：（由於留言騙子返還朋友錢款，暫時給他留點面子，打點馬賽克）查看端口，一猜就是寶塔面板搭建開着80，

斑林鴿的代碼世界

2024-05-12 14:02:58

24小時熱門文章

最新文章

最新評論文章