IKAnalyzer與solr4.0的整合方法

環境配置

Jdk1.6, tomcat6,solr4.0.0,IKAnalyzer 2012FF

2 軟件下載地址

Jdk1.6:http://download.oracle.com/otn-pub/java/jdk/6u37-b06/jdk-6u37-linux-i586.bin
tomcat6:http://archive.apache.org/dist/tomcat/tomcat-6/v6.0.29/bin/apache-tomcat-6.0.29.tar.gz
solr4.0.0:http://www.eu.apache.org/dist/lucene/solr/4.0.0/apache-solr-4.0.0.tgz
IKAnalyzer 2012FF:http://ik-analyzer.googlecode.com/files/IK%20Analyzer%202012FF_hf1.zip

3 安裝步驟

3.1 安裝JDK 
   JDK安裝省略,你只要安裝完成在環境中設置JAVA_HOME即可,比如我這邊是JAVA_HOME=/usr/local/jdk1.6.37

3.2 安裝Tomcat
    tomcat安裝省略,你只要安裝完成在環境中設置TOMCAT_HOME即可,比如我這邊是TOMCAT_HOME = /usr/local/tomcat

//編輯tomcat的配置文件server.xml,添加了一個URIEncoding="UTF-8",因爲solr的傳輸方式是utf-8格式的,不然中文會出現亂碼
#vim /usr/local/tomcat/conf/server.xml

<Connector port="8080" protocol="HTTP/1.1"
           connectionTimeout="20000"
           redirectPort="8443" URIEncoding="UTF-8" />

3.3 安裝solr

  //解壓solr壓縮文件
  #tar -zxvf  apache-solr-4.0.0.tgz    

  //建立solr的索引和配置的存放目錄
  #mkdir /opt/solr 

  //拷貝solr項目war包 
  #cp  apache-solr-4.0.0/dist/apache-solr-4.0.0.war  /opt/solr/solr.war

  //拷貝solr示例的配置文件
  #cp   -R apache-solr-4.0.0/example/solr/*   /opt/solr/

  //在tomcat下新建solr.xml文件,配置tomcat下solr的環境變量
  docBase:項目路徑,solr/home:solr的配置和索引文件存放路徑
  #vim  /usr/local/tomcat/conf/Catalina/localhost/solr.xml,加入以下內容:

<Context docBase=" /opt/solr/solr.war" debug="0" crossContext="true" >
    <Environment name="solr/home" type="java.lang.String" value="/opt/solr/" override="true" />
</Context>

3.4 安裝 IKAnalyzer 

  //解壓IKAnalyzer壓縮文件
  #unzip IK Analyzer 2012FF_hf1.zip

  //拷貝IKAnalyzer相關文件IKAnalyzer.cfg.xml, IKAnalyzer2012FF_u1.jar, stopword.dic到solr項目的lib下
  #cd IK Analyzer 2012FF_hf1

  #cp  IKAnalyzer.cfg.xml IKAnalyzer2012FF_u1.jar  stopword.dic  /usr/local/tomcat/webapps/solr

  //應用IKAnalyzer中文分詞功能,修改/opt/solr/collection1/conf/中的schema.xml,在<type></types>中增加如下內容:
 #vim /opt/solr/collection1/conf/schema.xml

 <fieldType name="text_suiyiwen" class="solr.TextField"> 
     <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>
 </fieldType>

  這樣shcma.xml文件中定義爲text_suiyiwen類型的字段就能使用IKAnalyzer中文分詞功能了。

4.啓動/停止solr

只要啓動/停止Tomcat即可

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章