Lucene的概述

一.作用

全文檢索。

二.數據分類

1.結構化數據

格式固定,長度固定,數據類型固定。

例如:數據庫

2.非結構化數據

格式不固定,長度不固定,數據類型不固定。

例如:word文檔,pdf文檔,郵件,html

三.數據的查詢

1.結構化查詢

sql語句。查詢結構化數據的方法。簡單、查詢數據快。

2.非結構化查詢

(1)方式一

使用程序將文檔讀取到內存中,然後匹配字符串,稱之爲順序掃描。

(2)方式二

先將字符串以空格進行分隔,得到一個單詞列表,基於單詞列表創建一個索引。然後查詢索引,根據單詞和文檔的對應關係找到文檔列表。這就叫做全文檢索。

四.全文檢索的概念

先創建索引,然後再查詢索引的過程就是全文檢索。

索引創建一次,可以多次使用。每次查詢數據很快。

五.全文檢索的應用場景

1.搜索引擎

百度、谷歌、搜狗。

2.站內搜索

論壇搜索、微博、文章搜索。

3.電商搜索

淘寶、京東。

4.總結

只要有搜索的地方,就可以用全文檢索。

六.什麼是Lucene

Lucene是一個基於Java開發全文檢索工具包。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章