8 個基於 Lucene 的開源搜索引擎

來自:http://www.open-open.com/news/view/1cdc9e3

Lucene是一種功能強大且被廣泛使用的搜索引擎,以下列出8種基於Lucene的搜索引擎,你可以想象他們有多麼強大...

Apache Solr
Solr是一個高性能,採用Java5開發,基於Lucene的全文搜索服務器。文檔通過Http利用XML加到一個搜索集合中。查詢該集合也是通過 http收到一個XML/JSON響應來實現。它的主要特性包括:高效、靈活的緩存功能,垂直搜索功能,高亮顯示搜索結果,通過索引複製來提高可用性,提 供一套強大Data Schema來定義字段,類型和設置文本分析,提供基於Web的管理界面等。

http://lucene.apache.org/solr/

Elastic Search
ElasticSearch是一個基於Lucene構建的開源,分佈式,RESTful搜索引擎。設計用於雲計算中,能夠達到實時搜索,穩定,可靠,快速,安裝使用方便。支持通過HTTP使用JSON進行數據索引。

http://www.elasticsearch.com

Index Tank
IndexTank, 一套基於Java的索引-實時全文搜索引擎實現,Includes features like variables (boosts), categories (facets), faceted search, snippeting, custom scoring functions, suggest, and autocomplete。IndexTank的設計分離了相關性標記和文檔內容,因爲相關性標記的生命週期和文檔本身是不一樣的,特別是在用戶創建的內容的情況下,例如 分享次數,Like按鈕,+1按鈕等等。

https://github.com/linkedin/indextank-engine

Katta

Katta是一個可擴展的、故障容錯的、分佈式實施訪問的數據存儲。

Katta可用於大量、重複、索引的碎片,以滿足高負荷和巨大的數據集。這些索引可以是不同的類型。當前該實現在Lucene和Hadoopmapfiles

http://katta.sourceforge.net/

Bobo Search

bobo-browse 是一用java寫的lucene擴展組件,通過它可以很方便在lucene上實現分組統計功能。

比如說搜索電腦,可以得到cpu是intel的有幾條命中記錄,cpu是amd的有幾條命中記錄。

https://github.com/javasoze/bobo

Compass

Compass是一個強大的,事務的,高性能的對象/搜索引擎映射(OSEM:object/search engine mapping)與一個Java持久層框架.Compass包括:

* 搜索引擎抽象層(使用Lucene搜索引薦),
* OSEM (Object/Search Engine Mapping) 支持,
* 事務管理,
* 類似於Google的簡單關鍵字查詢語言, 
* 可擴展與模塊化的框架,
* 簡單的API.

http://www.compass-project.org/

Summa

Summa是一種由java開發的,快速模塊化和可擴展的搜索引擎. Summa 有如下特點:

  • 綜合搜索. Summa 能夠同時訪問許多不同的數據和資料來源,並以一個統一的接口公開

  • 模塊化設計.Summa 搜索系統由一系列獨立模塊組成, 這樣使得它更簡單容易地被維護和升級

  • 可擴展性. Summa 支持分佈式架構而且能夠按比例的擴大或縮小以處理任何數量的數據

  • 開放標準. Summa 基於現代web技術與標準, 不包含任何私有代碼或原理.

  • 故障容錯. 如果某單一數據資源或服務出錯, Summa 將會繼續運行而不受出錯部分限制.

http://wiki.statsbiblioteket.dk/summa/

Constellio
Constellio 是一個開源的搜索解決方案,適合企業級的搜索。基於 Apache Solr 項目構建,使用 Lucene 做爲搜索引擎,並提供基於 Web 的網頁和文檔的檢索。可選擇文檔類型、文件夾以及文件名進行檢索。

http://constellio.com/

發佈了58 篇原創文章 · 獲贊 2 · 訪問量 2萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章