集成分詞器
集成IK中文分詞器
ES的安裝參見博文------------《Elastic Search入門》
- 下載IK分詞器,選擇對應版本的zip壓縮版。這裏以elasticsearch-analysis-ik-7.6.0.zip爲例。
- 將zip壓縮包上傳到服務器(/home/monk/Download/elasticsearch-analysis-ik-7.6.0.zip),解壓到ES的插件目錄(/apps/elasticsearch-7.6.0/plugins/elasticsearch-analysis-ik-7.6.0),如圖所示:
unzip /home/monk/Download/elasticsearch-analysis-ik-7.6.0.zip -d /apps/elasticsearch-7.6.0/plugins/elasticsearch-analysis-ik-7.6.0/
- 重啓ES即可
集成拼音分詞器
-
下載拼音分詞器,選擇對應版本的zip壓縮版。這裏以elasticsearch-analysis-pinyin-7.6.0.zip爲例
-
將zip壓縮包上傳到服務器(/home/monk/Download/elasticsearch-analysis-pinyin-7.6.0.zip),解壓到ES的插件目錄(/apps/elasticsearch-7.6.0/plugins/elasticsearch-analysis-ik-7.6.0),如圖所示:
unzip /home/monk/Download/elasticsearch-analysis-pinyin-7.6.0.zip -d /apps/elasticsearch-7.6.0/plugins/elasticsearch-analysis-pinyin-7.6.0/
-
重啓ES即可
驗證是否集成成功
- 默認分詞器效果
- IK分詞器效果
- ik_max_word: 會將文本做最細粒度的拆分,比如會將“中華人民共和國國歌”拆分爲“中華人民共和國,中華人民,中華,華人,人民共和國,人民,人,民,共和國,共和,和,國國,國歌”,會窮盡各種可能的組合,適合 Term Query;
- ik_smart: 會做最粗粒度的拆分,比如會將“中華人民共和國國歌”拆分爲“中華人民共和國,國歌”,適合 Phrase 查詢。
- 拼音分詞器效果