Lucene通過縮小搜索結果集來提升性能
一、緣起
Lucene在索引文件上G之後的搜索性能下降很嚴重,隨便跑個搜索就要上0.x秒。如果是單線程搜索那麼性能尚可,總可以在0.x秒返回結果,如果是Web式的多線程訪問,由於Lucene的內部機制導致數據被大量載入內存,用完後立即丟棄,隨之引起JVM頻繁GC,性能極其低下,1-10秒的長連接比比皆是。這也是世人爲之詬病的Lucene應用瓶頸問題,那麼是否有解決方法呢?
二、思路
我們來觀察Google, Baidu的搜索,有一個總體的感覺就是搜索結果多的關鍵詞耗時比較少,結果少的關鍵詞耗時反而多,且結果多的時候會說“約*** 閱讀全文
類別:搜索引擎 查看評論
Lucene在索引文件上G之後的搜索性能下降很嚴重,隨便跑個搜索就要上0.x秒。如果是單線程搜索那麼性能尚可,總可以在0.x秒返回結果,如果是Web式的多線程訪問,由於Lucene的內部機制導致數據被大量載入內存,用完後立即丟棄,隨之引起JVM頻繁GC,性能極其低下,1-10秒的長連接比比皆是。這也是世人爲之詬病的Lucene應用瓶頸問題,那麼是否有解決方法呢?
二、思路
我們來觀察Google, Baidu的搜索,有一個總體的感覺就是搜索結果多的關鍵詞耗時比較少,結果少的關鍵詞耗時反而多,且結果多的時候會說“約*** 閱讀全文
類別:搜索引擎 查看評論
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章
elasticsearch geo使用
建立索引 PUT /my_locations { "mappings": { "properties": { "pin": { "properties
小绿龙
2020-07-08 09:29:01
搜索初探
collin1211
2020-07-08 01:38:31
讓收費網站去死吧,用google 突破 下載
讓收費網站去死吧,用google 突破 下載首先打開google,在關鍵詞輸入框中輸入"index of/"inurl:lib(雙引號爲英文狀態下),
jkxsanger
2020-07-08 01:36:18
java平臺名人錄之nutch
cattong
2020-07-08 01:05:31
asp.net在線閱讀pdf
ytrf2541
2020-07-08 01:04:28
搜索引擎 asp.net 基本優化
James
2020-07-07 23:59:01
百度SEO指令--不是站長也必須看
苏飞论坛
2020-07-07 21:56:45
sphinx,coreseek安裝
罗罗罗罗罗罗健
2020-07-07 13:09:11
Lamp環境下安裝及使用coreseek
罗罗罗罗罗罗健
2020-07-07 12:30:40
Coreseek 介紹以及 windows版本安裝
罗罗罗罗罗罗健
2020-07-07 12:30:40
《程序員》2012年4期精彩內容:創業
kuangxiang_panpan
2020-07-07 11:21:01
heritrx增量抓取
SelfMedicated
2020-07-07 06:48:49