- 簡介
根據相關性排序,包括內容的相關性,以及內容本身的重要性,要度量頁面的重要性的判斷標準:某網頁被鏈接的次數以及鏈接這個網頁的網頁本身的重要性,被鏈接次數越多,鏈接這個網頁的網頁越重要,說明被鏈接的網頁越重要。
簡化模型
PageRank是根據網頁之間的連接關係計算網頁排名的技術。
PK值:從1到10級,值越大越重要。
簡化模型的缺陷:
page leak
page sink
隨機瀏覽模型
隨機上網者隨機點擊一個新頁面的概率作爲這個新頁面的PageRank值。
根據馬爾可夫鏈性質,迭代計算每個結點的PR值,隨着迭代次數的增加,PR值將趨於穩定。
- 利用稀疏矩陣簡化計算
由於網絡中的節點數非常大,因此引入稀疏矩陣來簡化計算。 鄰接矩陣
用鄰接矩陣G表示圖,即各結點之間的關係。g(ij)=1表示從i->j有鏈接存在,反之則表示沒有。
因此是一個N*N的矩陣。每一行之和:鏈出鏈接數
每一列之和:鏈入鏈接數
- 轉移概率矩陣