solr4.5部署到tomcat以及solr4.5配置中文分詞器mmseg4j

solr4.5部署到tomcat

solr默認自帶了jetty服務器,但我們習慣了tomcat,我們通過以下步驟將solr部署到tomcat

1、solr.4.5.0.zip解壓到指定的目錄中,如d:/solr-4.5.0

2、將d:/solr-4.5.0/example/webapps下的solr.war拷貝到tomcat–>weapps中

3、新建文件夾d:/sorl_home,將d:/solr-4.5.0/example/solr目錄拷貝至d:/sorl_home中

4、啓動tomcat,此時tomcat會把solr.war進行解壓,生成一個solr文件夾;停止tomcat,刪除solr.war。

5、用編輯器打開tomcat下面的solr/WEB-INF/web.xml,找到下面的代碼:

 <!--
    <env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>/put/your/solr/home/here</env-entry-value>
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>
  -->

打開註釋,修改成

   <env-entry>
       <env-entry-name>solr/home</env-entry-name>
       <env-entry-value>D:/solr_home/solr</env-entry-value><!--此處爲solr home的地址,在第三步中我們放置到D:/solr_home/solr-->
       <env-entry-type>java.lang.String</env-entry-type>
    </env-entry>

6、啓動tomcat,訪問:http://localhost:8080/solr

 

本文出自 luoshengsha.com,轉載時請註明出處及相應鏈接。

本文永久鏈接: http://www.luoshengsha.com/139.html



solr4.5配置中文分詞器mmseg4j

solr4.x雖然提供了分詞器,但不太適合對中文的分詞,給大家推薦一箇中文分詞器mmseg4j

mmseg4j的下載地址:https://code.google.com/p/mmseg4j/

通過以下幾步就可以把mmseg4j分詞器集成到solr中:

1、解壓mmseg4j-1.9.1.zip,把dist下面的所有jar文件拷貝到你應用服務器下的solr/WEB-INF/lib中(如果你的應用服務器下面沒有solr,請參考《solr部署到tomcat》)。

2、拷貝data到solr_home/solr中(與core文件平級),並改名爲dic(請參考《solr部署到tomcat》)

3、進入到你想使用mmseg4j分詞器的core中(此處以solr自帶的collection1爲例),用編輯器打開collection1/conf/schema.xml配置文件,添加如下代碼:

<!-- mmseg4j分詞器 -->
 <fieldType name="text_mmseg4j" class="solr.TextField" >
 <analyzer type="index">
 <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="../dic" /><!--此處爲分詞器詞典所處位置-->
 </analyzer>
 <analyzer type="query">
 <tokenizer class="com.chenlb.mmseg4j.solr.MMSegTokenizerFactory" mode="complex" dicPath="../dic" /><!--此處爲分詞器詞典所處位置-->
 </analyzer>
 </fieldType>

4、引用mmseg4j分詞器

上面我們已經定義了mmseg4j分詞器,如何引用呢?

用編輯器打開collection1/conf/schema.xml配置文件,找到<fields>…</fields>,修改需要使用中文分詞的字段,type=”text_mmseg4j”

<fields>
.......//省略
<field name="name" type="text_mmseg4j" indexed="true" stored="true" />
</fields>

通過以上步驟就可以成功配置mmseg4j分詞器到solr中了。

 

本文出自 luoshengsha.com,轉載時請註明出處及相應鏈接。

本文永久鏈接: http://www.luoshengsha.com/170.html

不過我按照這個配還是有問題,完整的“solr4.8.1部署到tomcat8.0.33”請看我的另一篇博客http://blog.csdn.net/ehcoing/article/details/51682145

發佈了30 篇原創文章 · 獲贊 24 · 訪問量 10萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章