Elasticsearch 7.6.2 引入IK Analysis

系統:Cent OS 7

Elasticsearch版本 : 7.6.2

Kibana版本:7.6.2

IK Analysis版本:7.x

參考資料:b站up主 “狂神說”

git地址:https://github.com/medcl/elasticsearch-analysis-ik/tree/master

 ik analyzer需要和es版本對應,當前master對應es 7.x版本,直接下載最新的就行。

下載完成後進入到es的plugins中,新建一個ik文件夾,把下載的壓縮包上傳到該文件夾下,解壓

切換用戶,啓動es會看到ik分詞器被加載了 

 打開kibana測試分詞

ik_smart爲最少切分

ik_max_word爲最細粒度劃分

 假如拆一個人名:張萬福,可以看到分詞器把名字拆成了2部分,如果想當做一個整體不被拆分這時候就需要自定義字典

自定義分詞器

進入到es插建plugin的ik文件夾中,.dic結尾的就是已存在的字典,我們需要創建一個.dic文件,裏面一個詞語單獨一行

vim people_name.dic

保存後需要在IKAnalyzer.cfg.xml中添加創建的字典

Ik是國人的項目,所以提示信息都很友好(說白了英文爛 0.0 ),多個自定義字典用英文分號“;”隔開。

保存後重啓es可以看到自定義字典被加載了

再次嘗試張萬福就沒有被拆分了

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章