一.作用
全文檢索。
二.數據分類
1.結構化數據
格式固定,長度固定,數據類型固定。
例如:數據庫
2.非結構化數據
格式不固定,長度不固定,數據類型不固定。
例如:word文檔,pdf文檔,郵件,html
三.數據的查詢
1.結構化查詢
sql語句。查詢結構化數據的方法。簡單、查詢數據快。
2.非結構化查詢
(1)方式一
使用程序將文檔讀取到內存中,然後匹配字符串,稱之爲順序掃描。
(2)方式二
先將字符串以空格進行分隔,得到一個單詞列表,基於單詞列表創建一個索引。然後查詢索引,根據單詞和文檔的對應關係找到文檔列表。這就叫做全文檢索。
四.全文檢索的概念
先創建索引,然後再查詢索引的過程就是全文檢索。
索引創建一次,可以多次使用。每次查詢數據很快。
五.全文檢索的應用場景
1.搜索引擎
百度、谷歌、搜狗。
2.站內搜索
論壇搜索、微博、文章搜索。
3.電商搜索
淘寶、京東。
4.總結
只要有搜索的地方,就可以用全文檢索。
六.什麼是Lucene
Lucene是一個基於Java開發全文檢索工具包。