solr4配置

Solr4.10.3安裝配置

環境準備

solr4.10.3下載地址:
http://archive.apache.org/dist/lucene/solr/

tomcat8下載地址:
http://tomcat.apache.org/download-80.cgi

安裝jdk8,配置好環境變量

tomcat啓動solr配置步驟

1:解壓tomcat與solr壓縮包,爲了方便操作,最好放入同一個目錄下
本次示例solr與tomcat目錄分別是F:\solr410\solr-4.10.3;F:\solr410\tomcat8solr410
2:將F:\solr410\solr-4.10.3\dist下的solr的war包拷貝到F:\solr410\tomcat8solr410\webapps 下,並且改名爲solr.war
3:將F:\solr410\solr-4.10.3\example\lib\ext 目錄下的包拷貝到F:\solr410\tomcat8solr410\lib下。這樣才能順利啓動tomcat並且使solr.war解壓
4:啓動tomcat,成功啓動後關閉tomcat。這樣就將F:\solr410\tomcat8solr410\webapps下面的solr.war解壓,產生一個solr文件夾,刪除solr.war文件
5:將F:\solr410\solr-4.10.3\dist 下的solr-dataimporthandler-4.10.3.jar 與solr-dataimporthandler-extras-4.10.3.jar 包拷貝到F:\solr410\tomcat8solr410\webapps\solr\WEB-INF\lib目錄下
6:在F:\solr410\tomcat8solr410\webapps\solr\WEB-INF\下創建一個文件夾classes。該文件夾後面可以用來存放solr的log4j文件與擴展詞,停止詞等配置文件
7:將F:\solr410\solr-4.10.3\example\resources下的log4j文件複製到步驟6創建的classes目錄下。
8:在tomcat根目錄下創建一個文件夾solr,F:\solr410\tomcat8solr410\solr,選擇F:\solr410\solr-4.10.3\example\example-DIH\solr目錄下的db文件夾及solr.xml配置文件拷貝到剛纔創建的目錄下
9:修改F:\solr410\tomcat8solr410\solr 下的solr.xml文件 將5-8行全部刪除,因爲我們只拷貝了db.下面幾個solr core目錄並沒有拷貝。
10:修改F:\solr410\tomcat8solr410\webapps\solr\WEB-INF下的web.xml文件,添加以下節點及配置

<env-entry>
   <env-entry-name>solr/home</env-entry-name>
   <env-entry-value>F:\solr410\tomcat8solr410\solr</env-entry-value>
   <env-entry-type>java.lang.String</env-entry-type>
</env-entry>

11:啓動tomcat,並且訪問 http://localhost:8080/solr。可以進入solr的管理頁面。並且存在一個core:db.如果頁面沒有任何紅色的警告,表明solr與tomcat集成已經成功

IKAnalyzer 分詞,擴展詞庫,停止詞,同義詞配置

因爲solr的版本更新太快,而且solr沒有自帶中文分析能力,所以我們在這邊需要選擇一箇中文分詞工具集成進solr,完成中文分詞的能力。當前比較流行的有IKAnalyzer,Paoding,mmseg4j
本例中選擇IKAnalyzer進行分詞。

1:國情需要IKAnalyzer包已經不能從google下載。本人會上傳至CSDN上。供大家下載
2:將IKAnalyzer2012FF_u1.jar包拷貝到F:\solr410\tomcat8solr410\webapps\solr\WEB-INF\lib目錄下.
**3:**F:\solr410\tomcat8solr410\webapps\solr\WEB-INF\classes 目錄下添加擴展詞文件:etc.dic,停止詞文件:stopword.dic,管理文件:IKAnalyzer.cfg.xml
4: etc.dic 擴展詞從第二行生效,每一行填寫一個詞,例如在第二行添加詞:蘇寧易購
**5:**stopword.dic可以存放一些不需要單獨分詞的連接詞。
**6:**IKAnalyzer.cfg.xml 文件內容爲:

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
    <comment>IK Analyzer 擴展配置</comment>
    <!--用戶可以在這裏配置自己的擴展字典 -->
    <entry key="ext_dict">etc.dic;</entry> 
    <!--用戶可以在這裏配置自己的擴展停止詞字典-->
    <entry key="ext_stopwords">stopword.dic;</entry> 
</properties>

7:在F:\solr410\tomcat8solr410\solr\ams\conf目錄下的schame.xml文件中添加節點



<fieldType name="text_zh" class="solr.TextField" positionIncrementGap="100">    
 <analyzer type="index">    
   <tokenizer class="org.wltea.analyzer.lucene.IKAnalyzerSolrFactory"  isMaxWordLength="false"/>    
   <filter class="solr.LowerCaseFilterFactory"/>    
 </analyzer>    
 <analyzer type="query">    
   <tokenizer class="org.wltea.analyzer.lucene.IKAnalyzerSolrFactory"  isMaxWordLength="true"/>         
   <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>    
   <filter class="solr.LowerCaseFilterFactory"/>    
 </analyzer>    
</fieldType>  

第一個節點只有分詞能力,第二個節點使用的是IKAnalyzer2012FF_u1.jar的擴展方法。具有同義詞能力。童鞋們都可以拷貝進去體驗體驗

8:啓動tomcat,重新刷新一下http://localhost:8080/solr.選擇db-Analysis
,在兩個文本框中輸入 蘇寧易購的東西不錯 可以選擇text_ik 與 text_zh分別查看效果。
9:打開F:\solr410\tomcat8solr410\solr\ams\conf目錄下的synonyms.txt文件。在最後一行加上:蘇寧易購,suning。重新啓動tomcat,刷新頁面。選擇text_zh體驗分詞結果。會發現在查詢的時候 蘇寧易購 旁邊出現 suning 的同義詞

**10:**F:\solr410\tomcat8solr410\solr\ams\conf目錄下schame.xml文件中選擇一個file,type屬性改爲 text_zh 或者 text_ik就能實現該字段的分詞查詢效果。

IKAnalyzer分詞包下載地址:傳送

http://download.csdn.net/detail/duxiaomeng1986_2008/9118217

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章