Slor配置中文分詞器IK Analyzer

  solr6.0中進行中文分詞器IK Analyzer的配置和solr低版本中最大不同點在於IK Analyzer中jar包的引用。一般的IK分詞jar包都是不能用的,因爲IK分詞中傳統的jar不支持solr6.0這個高版本的,所以就會發送運行錯誤的界面。下面就來介紹一下solr6.0中中文分詞器IK Analyzer的配置。

步驟1:

  下載solr6.0專用的IK Analyzer的jar包和相應的配置文件。因爲IK Analyzer可以很方便的對詞庫近些年擴展,所以我在IK Analyzer中加入了搜狗詞庫的配置,可以最大限度的收錄現在一些潮流的詞語。  IK Analyzer的jar包和相應的配置文件下載地址:點擊打開鏈接

步驟2:

  解壓上一個步驟所得到的壓縮包,將ik-analyzer-solr5-5.x.jar這個jar包放入solr項目下的WEB-INF\lib目錄中去,將IKAnalyzer.cfg.xml,mydict.dic(搜狗的擴展詞庫),stopword.dic放在solr項目下的WEB-INF\classes目錄中去。

步驟3:

  將項目下solrhome\mynode\conf下的managed-schema配置文件中</schema>上面加入如下配置信息:(如果這裏不懂的話可以去看我前幾篇的博客關於solr6.0項目的環境的配置 連接地址:點擊打開鏈接

  1. <span style="font-size:14px;">    <fieldType name="text_ik" class="solr.TextField">  
  2.         <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>  
  3.     </fieldType>  
  4.     <field name="text_ik"  type="text_ik" indexed="true"  stored="true"  multiValued="false" /></span>  
<span style="font-size:14px;">	<fieldType name="text_ik" class="solr.TextField">
		<analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
	</fieldType>
	<field name="text_ik"  type="text_ik" indexed="true"  stored="true"  multiValued="false" /></span>

步驟4:

  啓動Tomcat,打開solr項目主頁進行測試。測試結果如下:



結合上一講的MYSQL數據庫配置,這裏我集成了solr6.0+mysql5.0+IK Analyzer分詞。如果有興趣的可以下載下來看看,下載地址:點擊打開鏈接




發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章