[solr] solr5.5.2配置結巴分詞工具

 

爲什麼選擇結巴分詞

  • 分詞效率高
  • 詞料庫構建時使用的是jieba (python)

結巴分詞Java版本

  • 下載
git clone https://github.com/huaban/jieba-analysis
  • 編譯
  1. cd jieba-analysis

  2. mvn install

  • 注意
如果mvn版本較高,需要修改pom.xml文件,在plugins前面增加 

     或者直接下載jieba-analysis-1.0.2.jar:鏈接:https://pan.baidu.com/s/1kt3wE7v-hdrM_04asLyFGg  密碼:boda

 

solr tokenizer版本

./gladlew build

集成到solr

拷貝上面兩個jar包到solr的目錄下:server/solr-webapp/webapp/WEB-INF/lib

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章