初識Lucene全文索引

1、Lucene是什麼呢?

Lucene是apache軟件基金會4 jakarta項目組的一個子項目,是一個開放源代碼的全文檢索引擎工具包,

但它不是一個完整的全文檢索引擎,而是一個全文檢索引擎的架構,提供了完整的查詢引擎和索引引擎,

部分文本分析引擎(英文與德文兩種西方語言)。Lucene的目的是爲軟件開發人員提供一個簡單易用的

工具包,以方便的在目標系統中實現全文檢索的功能,或者是以此爲基礎建立起完整的全文檢索引擎。Lucene

是一套用於全文檢索和搜尋的開源程式庫,由Apache軟件基金會支持和提供。Lucene提供了一個簡單卻強

大的應用程式接口,能夠做全文索引和搜尋。在Java開發環境裏Lucene是一個成熟的免費開源工具。

就其本身而言,Lucene是當前以及最近幾年最受歡迎的免費Java信息檢索程序庫人們經常提到信息檢索程序庫,

雖然與搜索引擎有關,但不應該將信息檢索程序庫與搜索引擎相混淆。

2、Lucene能幹什麼呢?

 比如:你給它若干個字符串,然後它爲你提供一個全文搜索服務,告訴你要搜索的關鍵字出現在哪裏,

在這個基礎上你可以做任何符合這個條件的事情。在實際項目中應用於大數據量的查詢部分,就像天貓首頁

中搜索商品,如果使用模糊查詢先不說性能會非常差,其次用戶體驗效果非常不好。

 就拿天貓上來說,在首頁搜索框中輸入:洗面奶 (中間很多空格) 外套。

點擊搜索


會同時搜索出洗面奶、外套的所有商品,如果用模糊查詢這肯定是做不到的。

初識Lucene全文搜索引擎,對它有概念上的認識就OK了。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章