轉載自:http://blog.csdn.net/seven_zhao/article/details/42706049
Lucene是一個基於Java的全文信息檢索工具包,它不是一個完整的搜索應用程序,而是爲你的應用程序提供索引和搜索功能。Lucene 目前是 Apache Jakarta 家族中的一個開源項目。也是目前最爲流行的基於 Java 開源全文檢索工具包。
Lucene與應用程序的關係如下圖所示:
在對Lucene4.10的使用進行說明前,需要先了解以下幾個概念。
名稱 |
釋義 |
Document |
用來對需要進行索引的穩定進行描述,這裏的文檔可以來自於HTML、database、PDF、office(word/excel/ppt)、文本等 |
Field |
用來對document進行描述,表示document的一個域,可以理解爲對象的一個屬性 |
Analyzer |
對於需要進行索引的document來說,需要按照一定的規則將內容進行切分,這樣才能被索引。Analyzer的作用就是用來切詞 |
IndexWriter |
它是document和索引之間的橋樑,用來將document加載到索引中 |
Directory |
用來描述索引的存放位置 |
Query |
它可以將需要查詢的內容封裝成索引可以理解的內容 |
IndexSearch |
用來依據Query在索引中檢索符合條件的內容 |