Logstash之所以強悍的主要原因是filter插件;通過過濾器的各種組合可以得到我們想要的結構化數據。
grok正則表達式
grok正則表達式是logstash非常重要的一個環節;可以通過grok非常方便的將數據拆分和索引
語法格式:
(?<name>pattern)
?<name>表示要取出裏面的值,pattern就是正則表達式
例子:收集控制檯輸入,然後將時間採集出來
input {stdin{}}
filter {
grok {
match => {
"message" => "(?<date>\d+\.\d+)\s+"
}
}
}
output {stdout{codec => rubydebug}}
下圖可以看到採集出來了數字4.19賦值給date
定製化字段,取出想要的字段
還是按照上面的例子:
4.19 is luck day 然後取出每一個字段
input {stdin{}}
filter {
grok {
match => {
"message" => "(?<date>\d+\.\d+)\s+(?<is>\w+)\s+(?<luck>\w+)\s+(?<day>\w+)"
}
}
}
output {stdout{codec => rubydebug}}
結果截圖: