Lucene4.10使用教程(一):常用概念

轉載自:http://blog.csdn.net/seven_zhao/article/details/42706049


Lucene是一個基於Java的全文信息檢索工具包,它不是一個完整的搜索應用程序,而是爲你的應用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一個開源項目。也是目前最爲流行的基於 Java 開源全文檢索工具包。

Lucene與應用程序的關係如下圖所示:


在對Lucene4.10的使用進行說明前,需要先了解以下幾個概念。

名稱

釋義

Document

用來對需要進行索引的穩定進行描述,這裏的文檔可以來自於HTML、database、PDF、office(word/excel/ppt)、文本等

Field

用來對document進行描述,表示document的一個域,可以理解爲對象的一個屬性

Analyzer

對於需要進行索引的document來說,需要按照一定的規則將內容進行切分,這樣才能被索引。Analyzer的作用就是用來切詞

IndexWriter

它是document和索引之間的橋樑,用來將document加載到索引中

Directory

用來描述索引的存放位置

Query

它可以將需要查詢的內容封裝成索引可以理解的內容

IndexSearch

用來依據Query在索引中檢索符合條件的內容


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章