搜索引擎学习之旅2 - 搜索引擎分类

搜索引擎之旅系列往期文章:

中文搜索引擎原理分析与实现(1)基本理论

搜索引擎学习之旅1 - SEO的概念

 

搜索引擎也是可以分为很多种的,拿日常生活举例,大家经常用的Google/百度是搜索引擎,在app里最上边的搜索栏搜索商品/商店/anything else的也是搜索引擎。但是上面的搜索引擎并不是同一种,因此在本文我就梳理一下搜索引擎的种类。

1 全文搜索引擎

这是大家都知道的一种搜索引擎,较为典型的是百度/Google搜索引擎,全文搜索引擎也是难度最高的搜索引擎,需要使用爬虫从互联网上爬取各个网站的信息并保存在自己的数据库中,需要建立倒排索引从而能够快速地进行检索。当有用户发起检索请求之后,系统会检索与用户查询条件相匹配的相关记录,然后按照一定的排列顺序将结果返回给用户。

从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据存储层中调用;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。

2 目录搜索引擎

目录搜索引擎是网站内部常用的检索方式,是以人工方式或半自动方式搜集信息,由编辑员查看信息之后,人工形成信息摘要,并将信息置于事先确定的分类框架中。信息大多面向网站,提供目录浏览服务和直接检索服务。著名的目录搜索引擎如Yahoo、搜狐、新浪、网易搜索等。

目录搜索引擎虽然有搜索功能,但严格意义上不能称为真正的搜索引擎,只是按目录分类的网站链接列表而已。用户完全可以不使用关键词查询,仅按照分类目录也可找到所需要的信息。该类搜索引擎因为加入了人的智能,所以信息准确、导航质量高,缺点是需要人工介入、维护量大、信息量少、信息更新不及时。

3 元搜索引擎

可以简单的将元搜索理解为:元搜索是对于搜索引擎的搜索。

搜索引擎在接受用户查询请求时,同时在多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。

4 垂直搜索引擎

垂直搜索引擎本质上属于全文搜索引擎,只不过是针对某一个行业/领域的专业搜索引擎,是搜索引擎的细分和延申。

垂直搜索引擎为用户提供范围极为缩小、极具针对性的搜索信息,帮助用户节省大量查找的时间。因此,垂直搜索引擎格外受特定行业用户的青睐,他们是垂直搜索引擎的长期、稳定的用户群体。

 

 

Reference

1. https://baike.baidu.com/item/%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E/104812

2. https://blog.csdn.net/a724888/article/details/80993346

https://baike.baidu.com/item/%E7%9B%AE%E5%BD%95%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E/1190176

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章