使用logstash將Mysql中的數據導入到ElasticSearch中（詳細步驟，win_Elasticsearch）

原創

2020-02-20 17:26

在之前轉載的一騰訊高級工程師《一文徹底瞭解Logstash》對logstach有這詳細的介紹，這裏我只說明一下，將mysql中的數據使用logstash導入到es中，如何操作，具體步驟見下方：

下載logstash
https://artifacts.elastic.co/downloads/logstash/logstash-7.3.2.zip
解壓的指定目錄
在bin的同級目錄中創建存放mysql驅動jar的文件夾mysql
拷貝mysql驅動jar包到3中的mysql文件夾中
在config或bin下創建配置文件logstash.conf【話雖這樣說，不過我在config下並不成功】
logstash.conf內容，詳見配置文件

input {
  # 多張表的同步只需要設置多個jdbc的模塊就行了
  jdbc {
      # mysql 數據庫鏈接,shop爲數據庫名
      jdbc_connection_string => "jdbc:mysql://localhost:3306/spider?useUnicode=true&characterEncoding=utf8&serverTimezone=UTC"
      # 用戶名和密碼
      jdbc_user => "root"
      jdbc_password => "root"

      # 驅動
      jdbc_driver_library => "D:/es/logstash-7.3.2/mysql/mysql-connector-java-5.1.6-bin.jar"

      # 驅動類名
      jdbc_driver_class => "com.mysql.jdbc.Driver"
      jdbc_validate_connection => "true"

      #是否分頁
      jdbc_paging_enabled => "true"
      jdbc_page_size => "1000"
      #時區
      jdbc_default_timezone => "Asia/Shanghai"

      #直接執行sql語句
      statement => "select * from news where id >=:sql_last_value order by id asc"
      # 執行的sql 文件路徑+名稱
      # statement_filepath => "/hw/elasticsearch/logstash-6.2.4/bin/test.sql"

      #設置監聽間隔  各字段含義（由左至右）分、時、天、月、年，全部爲*默認含義爲每分鐘都更新
      schedule => "* * * * *"
      #每隔10分鐘執行一次
      #schedule => "*/10 * * * *"
      #是否記錄上次執行結果, 如果爲真,將會把上次執行到的 tracking_column 字段的值記錄下來,保存到last_run_metadata_path
      record_last_run => true
      #記錄最新的同步的offset信息
      last_run_metadata_path => "D:/es/logstash-7.3.2/logs/last_id.txt"

      use_column_value => true
      #遞增字段的類型，numeric 表示數值類型, timestamp 表示時間戳類型
      tracking_column_type => "numeric"
      tracking_column => "id"
      
      clean_run => false

      # 索引類型
      #type => "jdbc"
    }

}


output {
  elasticsearch {
        #es的ip和端口
        hosts => ["http://localhost:9200"]
        #ES索引名稱（自己定義的）
        index => "spider"
        #文檔類型
        document_type => "_doc"
        #設置數據的id爲數據庫中的字段
        document_id => "%{id}"
    }
    stdout {
        codec => json_lines
    }
}

啓動logstash，進入bin文件夾下，執行：logstash -f logstash.conf

喬治大哥

發佈了771 篇原創文章 · 獲贊 652 · 訪問量 12萬+

他的留言板關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

使用logstash將Mysql中的數據導入到ElasticSearch中（詳細步驟，win_Elasticsearch）

Spring Cloud 部署時如何使用 Kubernetes 作爲註冊中心和配置中心

java異常 The origin server did not find a current representation for the target resource or is not

如何將文件加添加成webapp

ajax post請求不走success org.springframework.web.util.NestedServletException: Request processing failed

java讀取配置文件properties

淺談一下什麼是越權問題？

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結