ELK-內置分詞器-simple_pattern分詞器

一.simple_pattern分詞器
simple_pattern分詞器是根據正則表達式進行分詞的分詞器
#創建映射並定義字段內容分詞的正則表達式
#正則表達式表示,如果連續有3個數字在一起,則可以被當作一個單詞
PUT myindex-simple_pattern
{
    "settings":
    {
        "analysis":
        {
            "analyzer":
            {
                "my_analyzer":
                {
                    "tokenizer":"my_tokenizer"                
                }          
            },
            "tokenizer":
            {
                   "my_tokenizer":
                   {
                       "type":"simple_pattern",
                       "pattern":"[0123456789]{3}"                   
                   }         
             }                 
        }    
    }
}

#對指定內容根據"myindex-simple_pattern"分詞器進行分詞
POST myindex-simple_pattern/_analyze
{
     "analyzer":"my_analyzer",
     "text":"fd-123-4567-890-xxd9-689-x987"
}
可以看到"fd-123-4567-890-xxd9-689-x987"被分成了5關鍵字,分詞之後的結果如下
["123","456","890","689","987"]

 


 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章