logstash简介及架构

原創

2020-07-05 09:58

1、logstash介绍

数据收集处理引擎
ETL工具

2、logstash架构简介

Logstash Event是一个java object，它对外暴露了获取内部字段以及修改内部字段值的一些api。

下面举例讲解：

stdin：标准输入

codec是line，这个codec的作用就是按照每一行切割数据，就是说把每一行都转换成logstash event

stdout：标准输出

codec是json，这个codec的作用就是把每一个logstash event转换成json的对象输出。

line codec decode是按照换行符\n切割的。所以一行原始数据被分成了两个event。

所以，在原始数据和event之间不是一对一的关系。

event经过json codec encode后就把每一个logstash event输出成 json object。

3、测试

可以看到上图的数据有一个message为空的数据，是因为在bar的后面又换了一行。

4、详细讲解logstash的架构

下图是logstash6.x的架构

input是可以有多个的，每个input都有自己的codec，箭头代表数据流向。

数据会经过Queue，Queue会把流入的数据分发到不同的pipeline中。

每一个pipeline有Batcher、filter、output。

Batcher的作用是批量的从Queue中取数据。Batcher是可以配置的，比如一次取一百个数据。

看上图可知我有三个pipeline。

5、Life of an Event

这里介绍logstash Event的生命历程。

web.log为我们的配置文件

随着时间的推移，Batcher会收集越来越多的数据，当达到了处理数据的条件之后（Batcher会有两种条件，数目或时间，数目达到了设定的阈值或者是时间到了），Batcher就会把数据发送到filter，在filter中对每一条logstash Event进行相关的处理。

最后output就会把数据输出到你指定的输出。

那么，输出之后，会把处理的ACK发送给Queue，代表着我刚才处理了哪些event。

6、Queue的分类

logstash有两个Queue，一个是In Memory在内存中的Queue，这个Queue是固定大小的，是没法通过配置文件来修改的。坏处就是下图所示。

为了解决这个问题，推出了持久化Queue就是Persistent Queue In Disk，这个就是基于磁盘对处理数据进行一个记录。

7、Persistent Queue In Disk

Data从Input进来，

Data到PQ中。
PQ会把这个数据在磁盘中备份一份。
PQ告诉Input说这条数据我已经收到了。前提是Input要支持这种机制，有了这种机制才能感知目前logstash的这种处理能力。

接下来蓝色部分，

数据就从PQ到filter output
output把事件处理之后就会发送ACK到PQ
PQ收到了这个ACK之后，就会把磁盘上的数据删除掉

这样就得知，即使发生了宕机，我的数据还是在disk中有的，只需要重启logstash把disk中的数据重新消费一次就解决了。

8、Memory Queue与PQ的性能

可以看到性能的下降不是很严重，估计是在5%以内，如果没有特殊需求一般建议把logstash的PQ打开。

9、打开PQ

queue.max_bytes默认是1GB，开大一点后，Queue能存储的数据也就多了一点。

还有一些：

path.queue PQ存到磁盘的哪个位置。

queue.page_capacity 控制消息队列每一个文件的大小。

queue.checkpoint.writes 提升容灾能力，如果是1 表示每写一个数据都去做盘，顶多也就会丢失一条数据。

10、logstash中线程的相关情况

调优的时候主要就是调整 Pipeline Workder Thread数。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

如何保障服务的高可用：提升可观测性

保障服務的高可用，必不可少的措施，就是需要對服務資源使用度量情況、運行異常、邏輯錯誤、請求鏈路、等各項度量指標、日誌和鏈路瞭如指掌，並且通過對服務的實時監控和分析，配置指標預警值，對異常進行告警，通知到相關負責人，通過可觀測性的提升，預防和

2024-02-26 00:41:47

Java日志框架学习

前言 Java開發者對於日誌框架，想必都不陌生。我自己使用過的有Log4j、logback。作爲Java開發者，應該都遇到因日誌包衝突導致的異常問題，排查過程也或多或少知曉 Java日誌接口包、橋接包、產品包的混亂關係，本篇目的是爲了

2024-02-22 23:52:29

阿里云消息队列 Kafka 生态集成的实践与探索

消息隊列 Kafka 簡介 Apache Kafka是一個分佈式流平臺，作爲互聯網領域不可或缺的消息組件，在全球獲得了廣泛的應用。在使用過程中，Kafka一般被作爲消息流轉的核心樞紐，上下游系統通過Kafka實現異步，削峯填谷。在大數據處

2023-03-01 00:13:05

微服务日志调用链事件(request-id)，从nginx到elk

Nginx生成request-id 每次請求通過nginx時，生成一個request-id,添加到請求頭上。通過nginx內置的 $request_id 實現 proxy_set_header X-Request-Id $reque

2022-04-30 13:40:44

es使用记录

此文章要對ES有一些基礎應用背景：官網重建，需要全網站檢索所有的文章、服務、附件等；數據庫設計上，由於業務隔離的原因，數據被分散在各個表中技術選型：在開發週期限制條件下，準備了兩個方案： 1、查詢直

2022-04-30 12:55:14

logstash将mysql数据映射到es过程中的date数据格式问题

問題現象： {"index"=>{"_index"=>"product", "_type"=>"_doc", "_id"=>"146", "status"=>400, "error"=>{"type"=>"mapper_parsing_e

2022-04-30 11:49:21

Spring中如何优雅地配置日志

背景 spring對logback提供了良好的支持，大部分情況下，不需要自定義logback配置文件而很多項目對logback在spring中的使用，很多都做了不必要的定製：通過logback.xml自定義配置：這種方式繞過了spri

2022-04-30 11:45:21

Rainbond通过插件整合ELK/EFK，实现日志收集

前言 ELK 是三個開源項目的首字母縮寫：Elasticsearch、Logstash 和 Kibana。但後來出現的 FileBeat 可以完全替代 Logstash的數據收集功能，也比較輕量級。本文將介紹 EFK: Elasticsea

2021-12-27 21:28:31

logstash学习

目前公司微商城已經上了k8s，但是日誌查看不是很方便，感覺沒有之前在虛擬機上（vm）上查看日誌方便。因爲之前的日誌是按照日期，進行壓縮打包的，但是在k8s中，查看日誌就沒有那麼方便，也不用用grep這些管道來方便查詢。 ###安裝 cd

2021-12-25 21:37:19

elasticsearch添加账号和权限

教程：安全入門 Tutorial: Getting started with security 準備工作：常用軟件-ELKF+kafka集羣安裝和配置Elasticsearch, Kibana, Logstash. 停止logstas

我的社會主義夢

2021-12-25 21:22:14

ELK+Filebeat 安装配置入门

https://www.elastic.co 上，elasticsearch，logstash (filebeat)，kibana 都有各自的教程，基本照做就可以跑通。但只是初步跑起來，如果要都作爲服務運行，需要使用 rpm

框架淘金者

2021-12-25 21:12:02

Kibana7.6.2设置elasticsearch索引过期时间，到期自动删除

一、背景 ELK系統裏面存放了大量日誌索引，只需要保留15天的日誌索引，希望到期自動刪除對應的索引; 本文的解決方案是給索引添加生命週期策略，不需要手動設置定時器去調用api刪除；二、設置索引生命週期策略(ILM) 創建一個新的策略

2021-12-25 21:12:02

Apache Log4j 2.15.0 已发布，DolphinScheduler 受漏洞影响较小

近期，Apache 開源日誌框架 Log4j2 被曝嚴重漏洞。經技術人員排查，Apache DolphinScheduler 1.3.1-1.3.9 版本所依賴的組件中包含 log4j-core-2.11.2.jar，因此會受到一定程度影響

2021-12-25 21:10:16

微服务架构复杂吗？看完这篇你就明白了！

點擊上方 " JAVA開發大本營 "關注, 置頂或星標一起學習每天晚上10點00分, 我們不見不散導讀本文將介紹微服務架構和相關的組件，介

程序猿無非那些事

2021-12-25 21:09:20

Beats 作为日志搜集器相关

Filebeat：ELK 協議棧的新成員，一個輕量級開源日誌文件數據蒐集器，基於 Logstash-Forwarder 源代碼開發，是對它的替代。在需要採集日誌數據的 server 上安裝 Filebeat，並指定日誌目錄或日誌文件後，F

2021-08-30 21:21:25

24小時熱門文章

最新文章

最新評論文章