solr添加IKAnalyzer分詞器

原創

zml19910925

2020-02-21 10:38

最近在學習solr時候，碰到一個問題，就是如果採用默認的分詞器，會將每個字都分割成一個詞組進行索引

比如：長沙市會被分詞爲 “長”，“沙”，“市”，這樣就達不到我想要的效果

例如：

  <field name="name" type="text_general" indexed="true" stored="true"/>

這個是默認的分詞器

 <fieldType name="text_general" class="solr.TextField" positionIncrementGap="100">
      <analyzer type="index">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
        <!-- in this example, we will only use synonyms at query time
        <filter class="solr.SynonymFilterFactory" synonyms="index_synonyms.txt" ignoreCase="true" expand="false"/>
        -->
        <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>	  
      <analyzer type="query">
        <tokenizer class="solr.StandardTokenizerFactory"/>
        <filter class="solr.StopFilterFactory" ignoreCase="true" words="stopwords.txt" />
        <filter class="solr.SynonymFilterFactory" synonyms="synonyms.txt" ignoreCase="true" expand="true"/>
        <filter class="solr.LowerCaseFilterFactory"/>
      </analyzer>
    </fieldType>

我對城市名稱進行索引

結果：

對每個字都進行了分詞

所以這裏我們需要手動加入分詞功能，我這裏採用的IKAnalyzer，這裏分詞，會進行詞組分詞 “長沙”，“市” 這樣

在schema.xml文件中加入

    <fieldType name="text_ik" class="solr.TextField">     
          <analyzer class="org.wltea.analyzer.lucene.IKAnalyzer"/>     
    </fieldType>

 <field name="name" type="text_ik" indexed="true" stored="true"/>

然後重啓

這樣效果就達到了，這裏和lucene的差不多滴！

zml19910925

發佈了36 篇原創文章 · 獲贊 3 · 訪問量 2萬+

私信關注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

solr添加IKAnalyzer分詞器

推薦2款開源、美觀的WinForm UI控件庫

NET9 AspnetCore將整合OpenAPI的文檔生成功能而無需三方庫

在Linux下管理MySQL的大小寫敏感性

log4j的優先級解讀與簡單實例

springmvc集成動態數據源

springmvc集成mongo

java動態代理解讀

solr集成mysql

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結