高級搜索-百度和必應

高級搜索

在這裏插入圖片描述

搜索引擎基本原理

搜索引擎的整體架構示意圖:
在這裏插入圖片描述我們來看一下搜索引擎的架構(上圖):

  1. 網絡爬蟲爬行互聯網連接
  2. 網頁計算去重;
  3. 添加索引;
  4. 內容,鏈接計算;
  5. 網頁排序;
  6. 形成對應詞典,存入cache系統;
  7. 用戶檢索;
  8. 分析內容,調出詞典內容。

這基本上是一個網頁從產生到呈現的過程,當然這個過程很複雜,這裏只是簡單的比擬出來。不過我們可以看到,網絡的爬蟲對我們網站是何等的重要,這也是很多賣蜘蛛池的原因吧。

其次是網頁的去重,因爲現在百度自身服務器內部很多的網頁緩存,蜘蛛爬去過得內容百度會經過一系列的計算後去除重複網頁,這裏面有一個比較複雜的算法,這個以後可以詳細來講。

我們看網頁的排序有兩個方面因素的影響:內容的相似性&鏈接分析,大概這就是我們常說的SEO“內容爲王,外鏈爲皇”理論依據吧。其實網頁排序的影響因素有很多,但是內容和鏈接是基礎的比較重要的影響因素。

網頁排序之後就是生成關鍵詞的詞典存入搜索引擎的Cache系統,一方面可以快速的提供用戶查詢信息,另一方面就是減輕搜索引擎的計算壓力。
鏈接:https://www.zhihu.com/question/19937854/answer/139418442

公衆號

在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章