logstash之input、codec

Logstash最強大的功能在於豐富的過濾器插件。此過濾器提供的並不單單是過濾的功能,還可以對進入過濾器的原始數據進行復雜的邏輯處理。甚至添加獨特的事件到後續流程中。

1、logstash基本語法組成

logstash主要由三部分組成:input、filter、output。而filter就是過濾器插件,這個組件可以不要,但是這樣子就不能體現出logtash的強大過濾功能了。

input{

  輸入插件

}

filter{

  過濾器插件

}

outer{

  輸出插件

}

下面我們依次對各個插件進行介紹

1.1、logstash輸入插件(input)

Logstash的輸入插件主要用來接收數據,Logstash支持多種數據源,常見的有讀取文件、標準輸入、讀取syslog日誌、讀取網絡數據等,這裏分別介紹下每種接收數據源的配置方法

我們先來看個例子:

input{
    file{
            path => ["/var/log/messages"]
        type => "system"
        start_position => "timestamp"
  }
}
output{
  stdout{
        codec => rubydebug
  }
}

這時我們有幾個小疑問:

1、logstash的input是怎麼樣接收日誌的呢?

  logstash使用一個名爲filewatch的ruby gem庫來監聽文件變化,並通過一個叫.sincedb的數據庫文件來記錄被監聽的日誌文件的讀取進度(時間戳)。這個sincedb數據文件的默認路徑在 <path.data>/plugins/inputs/file下面,文件名類似於.sincedb_452905a167cf4509fd08acb964fdb20c。而<path.data>表示logstash插件存儲目錄,默認是LOGSTASH_HOME/data。(rpm包安裝則是在/usr/share/logstash目錄下)。

 

2、logstash的input技術跟Linux的那個比較像呢?

  input就跟Linux的管道右側內容一樣,在Linux管道中,左側的輸出傳給管道的右側接收機制。而input就是如此,當他監聽一個文件時,會以tail -f命令的形式逐行獲取數據。不過input可以指定從哪個地方(某一時間戳)開始讀取,而start_position就是指定時間戳。如果不指定則從頭開始讀取。type則是用來標記時間類型。

下面舉個例子來看:

1.2、標準輸入

 stdin是從標準輸入獲取信息的。這裏我們看一個稍微複雜一點的例子:

input {
        stdin {
                add_field => {"key"=>"apple"}
                tags => ["add1"]
                type => "test1"        }
}

output {
                stdout {
                        codec => rubydebug
                }
}

然後我們啓動一下終端,大家要注意,我這裏沒有指定輸入文件,而指定的是stdin,表示標準輸入,意思就是交互式輸入數據。

[root@::172.31.22.29 /etc/logstash/conf.d]#/usr/share/logstash/bin/logstash -f /etc/logstash/conf.d/l1.conf
Sending Logstash logs to /var/log/logstash which is now configured via log4j2.propertieshello word                     #手動輸入此信息{
          "type" => "test1",
      "@version" => "1",
       "message" => "hello word",
    "@timestamp" => 2019-01-22T05:42:08.340Z,
          "tags" => [
        [0] "add1"
    ],
          "host" => "ip-172-31-22-29.ec2.internal",
           "key" => "apple"
}

type和tags是logstash的兩個特殊字段, type一般會放在input中標記事件類型, tags主要用於在事件中增加標籤,以便在後續的處理流程中使用,主要用於filter或output階段。

2、logstash編碼插件(Codec)

前面的例子中,其實我們就已經用過編碼插件codec了,就是這個rubydebug,它就是一種codec。

編碼插件(codec)可以在logstash輸入或輸出時處理不同類型的數據,同時,還可以更好更方便的與其他自定義格式的數據產品共存,比如:fluent、netflow、collectd等通用數據格式的其他產品。因此,logstash不只是一個input-->filter-->output的數據流,而且是一個input-->decode-->filter-->encode-->output的數據流。

codec支持的編碼格式常見有plain、json、json_lines等,下面依次介紹:

1、codec插件之plain

plain是最簡單的編碼插件,你輸入什麼信息,就返回什麼信息,諸如上面的例子中的timestamp、type等都不會帶有:

修改一下配置文件:

input {
        stdin {                       }
}

output {
                stdout {
                        codec => plain
                }
}

現在我們啓動一下:

[root@::172.31.22.29 /etc/logstash/conf.d]#/usr/share/logstash/bin/logstash -f /etc/logstash/conf.d/l1.conf
Sending Logstash logs to /var/log/logstash which is now configured via log4j2.properties2019-01-22T06:10:14.161Z ip-172-31-22-29.ec2.internal hello word      #在此輸入信息2019-01-22T06:10:19.382Z ip-172-31-22-29.ec2.internal hello word

2、codec插件之json、json_lines

有時候logstash採集的日誌是JSON格式,那我們可以在input字段加入codec => json來進行解析,這樣就可以根據具體內容生成字段,方便分析和儲存。如果想讓logstash輸出爲json格式,可以在output字段加入codec=>json。下面是一個包含json編碼的時間配置文件:

input {
        stdin {
        }
}

output {
                stdout {
                        codec => json
                }
}

啓動一下:

[root@:172.31.22.29 /etc/logstash/conf.d]#/usr/share/logstash/bin/logstash -f /etc/logstash/conf.d/l1.conf
Sending Logstash logs to /var/log/logstash which is now configured via log4j2.propertieshello word                #輸入此行信息{"host":"ip-172-31-22-29.ec2.internal","@version":"1","message":"hello word","@timestamp":"2019-01-22T06:27:27.191Z"}

你會發現插件是json的時候,。他會自帶一些信息,諸如host、@version、@timestamp。json的每個字段都是key:value格式,多個字段之間通過逗號分隔。這種輸出比較長,因此我們採用json_lines編碼格式稍微好一點。

2.1、我們演示一下在input裏面設置json格式會怎麼輸入呢?

input {
        stdin {
                codec => json
        }
}
output {
                stdout {
                }
}

接下來啓動一下服務:

[root@::172.31.22.29 /etc/logstash/conf.d]#/usr/share/logstash/bin/logstash -f /etc/logstash/conf.d/l1.conf
Sending Logstash logs to /var/log/logstash which is now configured via log4j2.properties{"message":"hello word","@version":"1","@timestamp":"2019-01-22T06:32:56.973Z","host":"ip-172-31-22-29.ec2.internal"}{
          "host" => "ip-172-31-22-29.ec2.internal",
    "@timestamp" => 2019-01-22T06:32:56.973Z,
      "@version" => "1",
       "message" => "hello word"
}

這裏就是說當我輸入紅色方框裏面的內容的時候,這裏我輸入的是一行JSON格式,然後系統就會返回給我信息。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章