原创 6 November 2009 - Lucene Java 2.9.1 available

This release fixes bugs from 2.9.0, including one serious bug whereby Boole

原创 換個交互方式:twitter

我twitter號: imjl_live_cn即時聊天太過於正式,經常怕騷擾到他人而不敢說。有時候分享東西給對此感興趣的朋友,卻又不知如何做?想找個志

原创 Examples of Searching Social Media

All these run on Lucene or Solr Pioneer in blog searching: Technorati Analy

原创 噢也,,期待已久的solr 1.4 發佈了

下載連接 http://www.apache.org/dyn/closer.cgi/lucene/solr/New Solr 1.4 features

原创 已知關鍵詞的快速索引

關鍵詞已知的情況下,快速索引。給定:1300個關鍵詞,在1000條信息中比較,將對應的關鍵詞和記錄id記錄下來。分析:簡單測試,將1300個關鍵詞放入

原创 關於全文檢索系統設計我的思考

全文搜索大體分爲:數據採集,索引,搜索。我認爲最重要的是搜索效果,大體表現在準確性,搜索結果排序,穩定,速度。準確和分詞相關,排序是如何讓最適合的結果

原创 新聞之主題相似計算

新聞轉載非常多,搜索新聞時常常碰到,結果裏有很多相似新聞出現在一個頁面,影響用戶查看。我這裏說個主題(也就是新聞題目)相似計算。分析:新聞主題大多是經

原创 新開一博客

因爲這裏不太穩定,,所以在baidu http://hi.baidu.com/imjl_cn/blog/ 新開一個,做備用。兩邊同時發,博文

原创 有償提供全文檢索服務(只針對lucene,solr)

簡單的全文搜索,那麼可以看下 [url=http://lucene.apache.org/solr/]solr[/url],能自己解決最好想要做下一個

原创 Contrived FieldCache Load Test: Lucene 2.4 VS Lucene 2.9

轉載:http://www.lucidimagination.com/blog/2009/09/22/contrived-fieldcache-loa

原创 我也成無業遊民了

紀 念 下 這 個 有 意 義 的 一 天 :D :D :D :D

原创 iphone 從3.0升級到3.1(帶越獄)

[b]只適合無鎖版[/b]我iphone是3.0+越獄。。。想要升級到3.1+越獄之前準備了,itunes最新版,3.1固件下載到本地,但是沒有安裝今

原创 這兩天都幹嘛了

聽朋友們說51job要多刷新簡歷,於是我在待業第二天就寫了簡歷,開始還能每天刷,後來隔幾天刷,現在懶得刷。-------------至今點擊率爲0.

原创 safari 我的常用快捷鍵

cmd爲蘋果鍵關閉tab cmd+w退出safari cmd+qtab切換

原创 如何選擇中文分詞

目前全文搜索用到的中文分詞,大都是開源和自己開發相應的算法很多,到底選哪個來寫,各有各的看法。我分享下我做過的供大家參考沒用過詞性的中文分詞,因爲我的業務用不到。用過的大部分開源的中文分詞,主要是基於字典對