Logstash之kafka數據入ElasticSearch

原創

珊瑚海的世界

2020-02-25 03:12

kafka裏面的數據都是自定義拼接的字符串需要在logstash中filter做分割；

如果是json格式，則會被自動解析，無需分割。

下面樣例：

input{
      kafka {
        zk_connect => "bdc41.hexun.com:2181,bdc40.hexun.com:2181,bdc46.hexun.com:2181,bdc54.hexun.com:2181,bdc53.hexun.com:2181"
        group_id => "logstash"
        topic_id => "CyLog"
        reset_beginning => false # boolean (optional)
        consumer_threads => 3  # number (optional)
        decorate_events => true
     }
}

filter {
     #用，分割
     ruby{
           init =>"@kname =['showflag','datetime','ip']"
           code =>"event.append(Hash[@kname.zip(event['message'].split(/,/))])" 
          # remove_field => ["message"]
     }

   #有漢字則去掉註解，防止中文亂碼，<span style="font-family: Arial, Helvetica, sans-serif;">當然如果傳入編碼不統一，則會報錯</span>
   #  urldecode {
   #      all_fields => true
   #  }
}

output{
    elasticsearch{
      hosts => [ "10.130.2.53:9200","10.130.2.46:9200","10.130.2.54:9200" ]
      flush_size=>50000
      workers => 5
      index=> "logstash-cylog"
    }   
}

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

數據驅動製造：EMQX ECP 指標監測功能增強生產透明度

邁向未來的工業生產，需要的不僅是自動化，更是智能化。如果工業企業的管理者能夠實時監測每一生產環節的設備運行狀態，每一數據點位情況，洞察和優化每一步生產流程，他們將能夠做出更精準的決策，提高生產效率和產品質量。通過集成先進的指標監測工具，

2024-06-03 22:11:10

探討篇（一）：服務粒度的藝術 - 簡化架構與避免服務氾濫

一、背景上週小組有個需求上線牽扯9個應用（小組目前維護了26個服務，由於團隊系統業務屬性特徵基於高可用、高性能原則拆分，有些是合理的，有些不是很合理的），同時上週OpsReview的一個微服務濫用典範案例（Promise服務A調用服務B，

2024-05-20 23:55:39

TiDB + ES：轉轉業財系統億級數據存儲優化實踐

以下文章來源於轉轉技術，作者戴美琪導讀本文詳細介紹了轉轉業財系統億級數據存儲優化的實踐。面對系統數據量大、慢查詢多等挑戰，轉轉業財採取了 TiDB 方案優化數據量問題，同時引入 Elasticsearch（ES）解決慢查詢難題。實踐表

2024-05-13 11:16:34

無需重新學習，使用 Kibana 查詢/可視化 SLS 數據

作者：荊磊場景現在通過 SLS 的 ES 兼容能力，可以很方便地實現用 Kibana 來查詢和可視化 SLS 的數據。對於從 ES 遷移到 SLS 的用戶可以繼續保留原來的 Kibana 使用習慣。下面來演示如何通過 Kibana 來訪

2024-04-28 21:12:20

日誌架構演進：從集中式到分佈式的Kubernetes日誌策略

當我們沒有使用雲原生方案部署應用時採用的日誌方案往往是 ELK 技術棧。這套技術方案比較成熟，穩定性也很高，所以幾乎成爲了當時的標配。可是隨着我們使用 kubernetes 步入雲原生的時代後， kubernetes 把以往的操作系統

2024-04-23 11:47:10

架構設計｜基於 raft-listener 實現實時同步的主備集羣

背景以及需求線上業務對數據庫可用性可靠性要求較高，要求需要有雙 AZ 的主備容災機制。主備集羣要求數據和 schema 信息實時同步，數據同步平均時延要求在 1s 之內，p99 要求在 2s 之內。主備集羣數據要求一致要求能夠在主

2024-04-18 01:07:18

更優性能與性價比，從自建 ELK 遷移到 SLS 開始

作者：荊磊背景 ELK (Elasticsearch、Logstash、Kibana) 是當下開源領域主流的日誌解決方案，在可觀測場景下有比較廣泛的應用。隨着數字化進程加速，機器數據日誌增加，自建 ELK 在面臨大規模數據、查詢性能等方

2024-04-15 21:12:22

美團外賣基於GPU的向量檢索系統實踐

到家搜索業務具有數據量大、過濾比高等特點，爲了在保證高召回率的同時進一步提高檢索性能，美團到家搜索技術團隊與基礎研發機器學習平臺團隊基於GPU實現了支持向量+標量混合檢索的通用檢索系統，召回率與檢索性能均有較大提升。本文將介紹我們在GPU

2024-04-12 21:15:18

高維解碼｜Redis 收緊許可證！開源軟件公司如何在雲時代生存？

最近，Redis 從開放源代碼的 BSD 許可證過渡到了更加限制性的 Server Side Public License (SSPLv1)。一石激起千層浪，Redis 的這一舉動，不僅分化了前 Redis 維護者，也再次引發業界對於“開

2024-04-08 21:20:20

甲方安全建設之日誌採集實操乾貨

前言沒有永遠的安全，如何在被攻擊的情況下，快速響應和快速溯源分析攻擊動作是個重要的話題。想要分析攻擊者做了什麼、怎麼攻擊進來的、還攻擊了誰，那麼日誌是必不可少的一項，因此我們需要儘可能採集多的日誌來進行分析攻擊者的動作，甚至在攻擊者剛落

2024-04-07 22:46:03

elasticsearch 監控查看活躍的search

GET _nodes/stats indexing 顯示已經索引了多少文檔。這個值是一個累加計數器。在文檔被刪除的時候，數值不會下降。還要注意的是，在發生內部索引操作的時候，這個值也會增加，比如說文檔更新。還列出了索引操作耗費

2024-04-07 13:07:02

阿里雲PAI大模型RAG對話系統最佳實踐

去年4月至9月，阿里雲人工智能平臺 PAI 團隊與大數據基礎工程技術團隊合作，構建了基於知識庫檢索增強的大模型答疑對話機器人，並在阿里雲官方答疑鏈路、研發小蜜、釘釘大數據技術服務助手等多個線上場景上線，顯著提升答疑效率。相關文檔：【萬字長文

2024-03-15 00:43:34

KubeSphere 社區雙週報｜2024.02.29-03.14

KubeSphere 社區雙週報主要整理展示新增的貢獻者名單和證書、新增的講師證書以及兩週內提交過 commit 的貢獻者，並對近期重要的 PR 進行解析，同時還包含了線上/線下活動和佈道推廣等一系列社區動態。本次雙週報涵蓋時間爲：202

2024-03-14 23:29:59

如何保障服務的高可用：提升可觀測性

保障服務的高可用，必不可少的措施，就是需要對服務資源使用度量情況、運行異常、邏輯錯誤、請求鏈路、等各項度量指標、日誌和鏈路瞭如指掌，並且通過對服務的實時監控和分析，配置指標預警值，對異常進行告警，通知到相關負責人，通過可觀測性的提升，預防和

2024-02-26 00:41:47

Java日誌框架學習

前言 Java開發者對於日誌框架，想必都不陌生。我自己使用過的有Log4j、logback。作爲Java開發者，應該都遇到因日誌包衝突導致的異常問題，排查過程也或多或少知曉 Java日誌接口包、橋接包、產品包的混亂關係，本篇目的是爲了

2024-02-22 23:52:29

24小時熱門文章

python gdal 安裝使用（Windows， python 3.6.8）

最新文章

最新評論文章