solr动态分词需求(IK)

一、修改字典

1.1 动态修改字典(表示使用哪些词来做索引)
 - /var/www/file/images2/solr/solr-8.5.0/server/solr-webapp/webapp/WEB-INF/classes/dynamicdic.txt

 - 需求描述:
    可以在链接solr服务里查看字段分词情况,根据分词情况考虑是否需要新增字典。
    如:输入“新冠肺炎”分词情况为"新"、"冠"、"肺炎",当“新冠肺炎”这个词需要当做一个完整词整体索引时,需要添加这个词到dynamicdic.txt
    重新索引后,输入“新冠肺炎”分词情况为"新冠肺炎"、"肺炎",此时就能查询到内容中包含"新冠肺炎"的数据了

1.2 动态修改停用词(表示不用哪些词做索引)
 - /var/www/file/images2/solr/solr-8.5.0/server/solr-webapp/webapp/WEB-INF/classes/stopword.dic

 - 需求描述:
 当不需要某个词作为索引时,或者不希望搜索某个词的数据时,添加词到stopword.dic
 如:不希望搜索到"法轮功"相关的数据,首先搜索"法轮功",如果有数据,则添加"法轮功"到stopword.dic
 重建索引后,再搜索则无数据。

1.3 修改字典后同步修改时间戳
 - /var/www/file/images2/solr/solr-8.5.0/server/solr-webapp/webapp/WEB-INF/classes/ik.conf
lastupdate=[当前时间戳]

二、重建索引

2.1 当修改字典后,新增的数据将会应用新字典,老数据需要重新索引才能应用,如果新增了字典,而老数据没有重建索引的话,是查询不到数据的 
  如:新增字典:新冠肺炎
 - 输入新冠肺炎查询,将查询不到老数据,只能查询新数据
 - 只有重建索引后才能查询老数据

2.2 重建索引接口:curl localhost:8982/index-all?id=2245770  
 - id参数说明:索引id大于这个数值的数据
 - 如果id为空,则重新索引全量数据,已测135万数据索引需要一个小时,谨慎操作

2.3 需要扩展重建索引接口,增加查询条件,如日期范围、ID范围、contentText模糊查询、title模糊查询

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章