solr6.0中進行中文分詞器IK Analyzer的配置和solr低版本中最大不同點在於IK Analyzer中jar包的引用。一般的IK分詞jar包都是不能用的,因爲IK分詞中傳統的jar不支持solr6.0這個高版本的,所以就會發送運行錯誤的界面。下面就來介紹一下solr6.0中中文分詞器IK Analyzer的配置。
步驟1:
下載solr6.0專用的IK Analyzer的jar包和相應的配置文件。因爲IK Analyzer可以很方便的對詞庫近些年擴展,所以我在IK Analyzer中加入了搜狗詞庫的配置,可以最大限度的收錄現在一些潮流的詞語。 IK Analyzer的jar包和相應的配置文件下載地址:點擊打開鏈接
步驟2:
解壓上一個步驟所得到的壓縮包,將ik-analyzer-solr5-5.x.jar這個jar包放入solr項目下的WEB-INF\lib目錄中去,將IKAnalyzer.cfg.xml,mydict.dic(搜狗的擴展詞庫),stopword.dic放在solr項目下的WEB-INF\classes目錄中去。
步驟3:
將項目下solrhome\mynode\conf下的managed-schema配置文件中</schema>上面加入如下配置信息:(如果這裏不懂的話可以去看我前幾篇的博客關於solr6.0項目的環境的配置 連接地址:點擊打開鏈接)
- <span style="font-size:14px;"> <fieldType name="text_ik" class="solr.TextField">
- <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
- </fieldType>
- <field name="text_ik" type="text_ik" indexed="true" stored="true" multiValued="false" /></span>
<span style="font-size:14px;"> <fieldType name="text_ik" class="solr.TextField">
<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
</fieldType>
<field name="text_ik" type="text_ik" indexed="true" stored="true" multiValued="false" /></span>
步驟4:
啓動Tomcat,打開solr項目主頁進行測試。測試結果如下:
結合上一講的MYSQL數據庫配置,這裏我集成了solr6.0+mysql5.0+IK Analyzer分詞。如果有興趣的可以下載下來看看,下載地址:點擊打開鏈接