page-rank模型講解

  • 簡介
    根據相關性排序,包括內容的相關性,以及內容本身的重要性,要度量頁面的重要性的判斷標準:某網頁被鏈接的次數以及鏈接這個網頁的網頁本身的重要性,被鏈接次數越多,鏈接這個網頁的網頁越重要,說明被鏈接的網頁越重要。

  • 簡化模型

    PageRank是根據網頁之間的連接關係計算網頁排名的技術。
    PK值:從1到10級,值越大越重要。
    這裏寫圖片描述

    簡化模型的缺陷:
    page leak
    page sink


  • 隨機瀏覽模型
    隨機上網者隨機點擊一個新頁面的概率作爲這個新頁面的PageRank值。
    隨機瀏覽模型的PR值計算公式

    根據馬爾可夫鏈性質,迭代計算每個結點的PR值,隨着迭代次數的增加,PR值將趨於穩定。

這裏寫圖片描述


  • 利用稀疏矩陣簡化計算
    由於網絡中的節點數非常大,因此引入稀疏矩陣來簡化計算。
  • 鄰接矩陣
    用鄰接矩陣G表示圖,即各結點之間的關係。g(ij)=1表示從i->j有鏈接存在,反之則表示沒有。
    因此是一個N*N的矩陣。

    每一行之和:鏈出鏈接數
    每一列之和:鏈入鏈接數


  • 轉移概率矩陣
    這裏寫圖片描述

這裏寫圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章