系統:Cent OS 7
Elasticsearch版本 : 7.6.2
Kibana版本:7.6.2
IK Analysis版本:7.x
參考資料:b站up主 “狂神說”
git地址:https://github.com/medcl/elasticsearch-analysis-ik/tree/master
ik analyzer需要和es版本對應,當前master對應es 7.x版本,直接下載最新的就行。
下載完成後進入到es的plugins中,新建一個ik文件夾,把下載的壓縮包上傳到該文件夾下,解壓
切換用戶,啓動es會看到ik分詞器被加載了
打開kibana測試分詞
ik_smart爲最少切分
ik_max_word爲最細粒度劃分
假如拆一個人名:張萬福,可以看到分詞器把名字拆成了2部分,如果想當做一個整體不被拆分這時候就需要自定義字典
自定義分詞器
進入到es插建plugin的ik文件夾中,.dic結尾的就是已存在的字典,我們需要創建一個.dic文件,裏面一個詞語單獨一行
vim people_name.dic
保存後需要在IKAnalyzer.cfg.xml中添加創建的字典
Ik是國人的項目,所以提示信息都很友好(說白了英文爛 0.0 ),多個自定義字典用英文分號“;”隔開。
保存後重啓es可以看到自定義字典被加載了
再次嘗試張萬福就沒有被拆分了