搜索引擎的组成:
1、找到一种搜集文档的方法,进行文档搜索。
2、为网页建立索引。
3、通过查询返回一个经过排序的列表。
在组成1中,其实质为通过一种“可行”的方法,将网页存储在指定的位置。
在组成2中,其实质是将网页信息保存在数据库中,网页信息包括:(1)网页的URL。(2)网页中的单词。(3)网页中单词的位置。(4)介于文档之间的链接信息:一个文档与另一个文档链接关系和哪些单词与链接实际相关。
在组成3中,查询的实质是对已经建立的数据库进行条件查询。排序是搜索的精华所在,其排序的实现方式决定了该搜索的效率和搜索引擎的商业前途,排序的方法有两种:基于内容的排名方法和基于外部回指链接排名法。关于这两种方法的介绍,下次继续谈~~~~