solr有默认的中文分词,现在看下基本的一些操作
插入数据
查询数据,这里solr自带的中文分词器,但是并没有进行分词,而是拆分成每个文字
使用Query
这里我们记录下IK分词器,需要自定义扩展词库
1、下载ik-analyzer-7.5.0.jar,地址https://search.maven.org/search?q=com.github.magese
源码包地址https://github.com/magese/ik-analyzer-solr7
2、将jar包复制到solr项目的lib目录下,E:\solr\apache-tomcat-8.0.48\webapps\solr\WEB-INF\lib
3、修改E:\solr\solrHome\new_core\conf下的managed-schema,
添加如下内容
<!-- ik分词器 -->
<fieldType name="text_ik" class="solr.TextField">
<analyzer type="index">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="false" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
<analyzer type="query">
<tokenizer class="org.wltea.analyzer.lucene.IKTokenizerFactory" useSmart="true" conf="ik.conf"/>
<filter class="solr.LowerCaseFilterFactory"/>
</analyzer>
</fieldType>
4、重启tomcat,我们可以看到已经加载IK配置了
5、访问solr管理界面操作,选择text_ik,IK就可以帮我们进行分词