搜索引擎學習之旅2 - 搜索引擎分類

搜索引擎之旅系列往期文章:

中文搜索引擎原理分析與實現(1)基本理論

搜索引擎學習之旅1 - SEO的概念

 

搜索引擎也是可以分爲很多種的,拿日常生活舉例,大家經常用的Google/百度是搜索引擎,在app裏最上邊的搜索欄搜索商品/商店/anything else的也是搜索引擎。但是上面的搜索引擎並不是同一種,因此在本文我就梳理一下搜索引擎的種類。

1 全文搜索引擎

這是大家都知道的一種搜索引擎,較爲典型的是百度/Google搜索引擎,全文搜索引擎也是難度最高的搜索引擎,需要使用爬蟲從互聯網上爬取各個網站的信息並保存在自己的數據庫中,需要建立倒排索引從而能夠快速地進行檢索。當有用戶發起檢索請求之後,系統會檢索與用戶查詢條件相匹配的相關記錄,然後按照一定的排列順序將結果返回給用戶。

從搜索結果來源的角度,全文搜索引擎又可細分爲兩種,一種是擁有自己的檢索程序(Indexer),俗稱“蜘蛛”(Spider)程序或“機器人”(Robot)程序,並自建網頁數據庫,搜索結果直接從自身的數據存儲層中調用;另一種則是租用其他引擎的數據庫,並按自定的格式排列搜索結果,如Lycos引擎。

2 目錄搜索引擎

目錄搜索引擎是網站內部常用的檢索方式,是以人工方式或半自動方式蒐集信息,由編輯員查看信息之後,人工形成信息摘要,並將信息置於事先確定的分類框架中。信息大多面向網站,提供目錄瀏覽服務和直接檢索服務。著名的目錄搜索引擎如Yahoo、搜狐、新浪、網易搜索等。

目錄搜索引擎雖然有搜索功能,但嚴格意義上不能稱爲真正的搜索引擎,只是按目錄分類的網站鏈接列表而已。用戶完全可以不使用關鍵詞查詢,僅按照分類目錄也可找到所需要的信息。該類搜索引擎因爲加入了人的智能,所以信息準確、導航質量高,缺點是需要人工介入、維護量大、信息量少、信息更新不及時。

3 元搜索引擎

可以簡單的將元搜索理解爲:元搜索是對於搜索引擎的搜索。

搜索引擎在接受用戶查詢請求時,同時在多個引擎上進行搜索,並將結果返回給用戶。著名的元搜索引擎有InfoSpace、Dogpile、Vivisimo等,中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索結果排列方面,有的直接按來源引擎排列搜索結果,如Dogpile,有的則按自定的規則將結果重新排列組合,如Vivisimo。

4 垂直搜索引擎

垂直搜索引擎本質上屬於全文搜索引擎,只不過是針對某一個行業/領域的專業搜索引擎,是搜索引擎的細分和延申。

垂直搜索引擎爲用戶提供範圍極爲縮小、極具針對性的搜索信息,幫助用戶節省大量查找的時間。因此,垂直搜索引擎格外受特定行業用戶的青睞,他們是垂直搜索引擎的長期、穩定的用戶羣體。

 

 

Reference

1. https://baike.baidu.com/item/%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E/104812

2. https://blog.csdn.net/a724888/article/details/80993346

https://baike.baidu.com/item/%E7%9B%AE%E5%BD%95%E6%90%9C%E7%B4%A2%E5%BC%95%E6%93%8E/1190176

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章