[solr] - IKAnalyzer 擴展分詞庫

在solr中加入自己的擴展分詞庫方法:

參考文章:

http://www.cnblogs.com/dennisit/archive/2013/04/07/3005847.html 

 

1、在solr的web中:\WEB-INF目錄下新增一個文件夾:classes

 

2、新增一個文件:IKAnalyzer.cfg.xml

複製代碼
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE properties SYSTEM "http://java.sun.com/dtd/properties.dtd">  
<properties>  
    <comment>IK Analyzer 擴展配置</comment>
    <!--用戶可以在這裏配置自己的擴展字典-->
    <entry key="ext_dict">my.dic;</entry> 
    
    <!--用戶可以在這裏配置自己的擴展停止詞字典-->
    <entry key="ext_stopwords">stopword.dic;</entry> 
    
</properties>
複製代碼

說明:

my.dic即爲擴展分詞庫,分詞庫可以爲多個,以分號隔開即可。停止詞庫一樣。

 

3、新增my.dic文件。文件格式必需是:無BOM的UTF-8格式,示例內容爲:

西麗

 

4、保存,重啓solr。

使用了新的分詞,需要重新建索引數據。

 

5、測試:

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章