搜索引擎的組成:
1、找到一種蒐集文檔的方法,進行文檔搜索。
2、爲網頁建立索引。
3、通過查詢返回一個經過排序的列表。
在組成1中,其實質爲通過一種“可行”的方法,將網頁存儲在指定的位置。
在組成2中,其實質是將網頁信息保存在數據庫中,網頁信息包括:(1)網頁的URL。(2)網頁中的單詞。(3)網頁中單詞的位置。(4)介於文檔之間的鏈接信息:一個文檔與另一個文檔鏈接關係和哪些單詞與鏈接實際相關。
在組成3中,查詢的實質是對已經建立的數據庫進行條件查詢。排序是搜索的精華所在,其排序的實現方式決定了該搜索的效率和搜索引擎的商業前途,排序的方法有兩種:基於內容的排名方法和基於外部回指鏈接排名法。關於這兩種方法的介紹,下次繼續談~~~~