solr有默認的中文分詞,現在看下基本的一些操作
插入數據
查詢數據,這裏solr自帶的中文分詞器,但是並沒有進行分詞,而是拆分成每個文字
使用Query
這裏我們記錄下IK分詞器,需要自定義擴展詞庫
1、下載ik-analyzer-7.5.0.jar,地址https://search.maven.org/search?q=com.github.magese
源碼包地址https://github.com/magese/ik-analyzer-solr7
2、將jar包複製到solr項目的lib目錄下,E:\solr\apache-tomcat-8.0.48\webapps\solr\WEB-INF\lib
3、修改E:\solr\solrHome\new_core\conf下的managed-schema,
添加如下內容
<!-- ik分詞器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
4、重啓tomcat,我們可以看到已經加載IK配置了
5、訪問solr管理界面操作,選擇text_ik,IK就可以幫我們進行分詞