IK分詞器插件

原創

2020-06-10 02:54

IK分詞器插件

什麼是IK分詞器？

分詞：即把一段中文或者別的劃分成一個個的關鍵字，我們在搜索時候會把自己的信息進行分詞，會把數據庫中或者索引庫中的數據進行分詞，然後進行一個匹配操作，默認的中文分詞是將每個字看成一個詞，比如 “我愛小葉曲” 會被分爲"我","愛","小","葉","曲" 這顯然是不符合要求的，所以我們需要安裝中文分詞器ik來解決這個問題。

如果要使用中文，建議使用ik分詞器！

IK提供了兩個分詞算法：ik_smart 和 ik_max_word，其中 ik_smart 爲最少切分，ik_max_word爲最細粒度劃分！

安裝：

https://github.com/medcl/elasticsearch-analysis-ik

下載完畢之後，放入到我們的elasticsearch 插件即可！

重啓觀察ES，可以看到ik分詞器被加載了！

elasticsearch-plugin list 可以通過這個命令來查看加載進來的插件

使用kibana測試！

查看不同的分詞效果

其中 ik_smart 爲最少切分

ik_max_word爲最細粒度劃分！窮盡詞庫的可能！字典！

我們輸入 “超級喜歡賈宇光”

發現問題：“賈宇光” 被拆開了！

這種自己需要的詞，需要自己加到我們的分詞器的字典中！

ik 分詞器增加自己的配置！

重啓es，看細節！

再次測試一下狂神說，看下效果！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

elastic search集成cloudera

https://www.elastic.co/downloads/hadoop

2022-12-19 09:37:34

006-ELK的二進制安裝

二進制安裝ELKstack 本次搭建屬於單點，在同一臺機器上進行安裝基礎組件部署 curl -o /etc/yum.repos.d/CentOS-Base.repo http://mirrors.aliyun.com/repo/Cent

2021-09-30 09:13:00

七、分佈式環境搭建——ElasticSearch集羣搭建及集羣管理工具cerebro

首先各節點安裝好elasticsearch 參考：https://mp.csdn.net/mdeditor/91390470# 1 集羣配置elasticsearch.yml （1）節點1配置 cluster.name: tan

2020-07-08 11:45:49

ELasticSearch分片原理

文章目錄一、分片內部原理1.1 文檔可被搜索1.2 動態更新索引1.3 近實時搜索1.4 持久化變更1.5 段合併 Elasticsearch數據存儲在分片中，然後分片分配到集羣中的節點上。當集羣擴容或縮小，Elastics

2020-07-08 11:20:01

Elasticsearch 定製評分（自定義評分）

Elasticsearch 的相似度算法被定義爲檢索詞頻率/反向文檔頻率， TF/IDF 。一. 相關概念：檢索詞頻率：tf 詞 t 在文檔 d 的詞頻（ tf ）是該詞在文檔中出現次數的平方根。 tf(t in d) =

闲敲代码、落灯花

2020-07-07 23:49:18

Elasticsearch實戰：給博客打造全文檢索

學習和使用Elasticsearch有一段時間了，項目中大量使用到了es，但對於我來說都是部分或者局部地去使用，所以得找個時間好好整理並且再完整實踐一下es，於是就有了這篇文章。首先系統架構是LNMP，很簡單的個人博客網站（

闲敲代码、落灯花

2020-07-07 23:49:18

ES在Linux下安裝的那些破事

先贊後看，養成習慣 🌹 歡迎微信關注[Java編程之道],每天進步一點點，沉澱技術分享知識。最近公司需要一個Es環境，於是藉此機會對Es和可視化的安裝流程進行了一次梳理。現在ES已經到7.7了跟我以前接觸的版本還是存在一些

爱唠嗑的阿磊

2020-07-07 23:22:07

ElasticSerch查詢語句

#新增索引庫 PUT /heima #查詢索引庫 GET /heima #刪除索引庫 DELETE /heima #創建映射 PUT /heima/_mapping { “properties”:{ “title”:{ “type

2020-07-07 14:52:31

Centos7搭建ES服務器步驟以及錯誤解決

簡介 ElasticSearch（簡稱ES） ES即爲了解決原生Lucene使用的不足，優化Lucene的調用方式，並實現了高可用的分佈式集羣的搜索方案，其第一個版本於2010年2月出現在GitHub上並迅速成爲最受歡迎的項目之一。

开开心心写Bug

2020-07-07 11:57:07

Linux下配置搜索引擎ElasticSearch7.8.0

項目需要搜索引擎，之前用的額solr，最近朋友介紹ElasticSearch更方便，更流行 1、解壓下載地址：https://www.elastic.co/cn/downloads/elasticsearch tar -zxvf

2020-07-07 06:32:37

ES實現nested類型聚合以及子聚合排序

ES實現nested類型聚合以及子聚合排序ES實現nested類型聚合以及子聚合排序需求業務說明品牌近7天銷量品牌近7日銷量趨勢指定某個sku日期範圍銷量趨勢和價格趨勢電商商品日銷量索引mapping電商商品sku銷量索引數據參考

2020-07-07 02:36:25

Spring Cloud | ElasticSearch（es）的使用

一、簡述 ES(ElasticSearch)是一款分佈式全文檢索框架，每個字段可以被索引與搜索；以勝任上百個服務節點的擴展，並支持PB級別的結構化或者非結構化數據；底層基於基於Lucene實現。 ES與傳統數據的區別： 1、結構名稱不同：

2020-07-07 00:52:06

spark監控streamingListener使用與監控告警

Spark-steaming監控設計與驗證方案 created by fangchangtan | 2020/2/24 原創不易，謝絕白嫖，好的話就點

2020-07-07 00:27:52

安裝elasticalert配置驗證文檔

docker 安裝、配置、驗證ElasticAlert created by fangchangtan | 2020/2/24 1.elastalert的場景用途 elastalert組件作爲elk中日

2020-07-07 00:27:52

elasticsearch plane 踩的坑

問題背景：在使用ES內置的座標距離篩選功能時，出現了問題，有一部分理論上平面距離大於界定值的數據，並沒有被篩選掉因爲百度和google找到的文獻，都只是提及了ES的plane算法的優勢劣勢，但對其具體實現都是沒有提及，所以我只能硬着

2020-07-06 02:57:59

24小時熱門文章

最新文章

最新評論文章