图神经网络07-PageRank算法

原創

2021-04-12 17:59

在本节中，我们将探讨PageRank算法，其实这是一个老生常谈的概念或者算法，在这里我们重新温故下这个经典算法。这是一种使用Web Graph中的链接结构按重要性对网页进行排名的方法，这也是Google普及的网络搜索常用算法。在讨论PageRank之前，让我们先将Web概念化为图，然后尝试使用图论语言来研究其结构。

将Web看做Graph

我们可以将万维网是将网页看成节点，网页之间的超链接看做成边组成的Graph，同时我们可以一下假设：

仅考虑静态网页
忽略网络上的暗网（即无法访问的网页，防火墙保护的页面）所有链接都是可导航的。不考虑交易或者行为链接（例如：喜欢，购买，关注等）。

通过上述方式将万维网概念化为Graph之后，我们看看当前流行的搜索引擎如何使用它。例如，Google使用爬虫为网页编制索引，这些爬虫通过按广度优先遍历访问链接来浏览网络。可以通过这种方式遍历的图的还有很多其他例子，比如：科学研究论文之间的引文图，我们写论文的时候参考文献引用；百科全书中的参考文献。

万维网的Graph到底长什么样子

在2000年，AltaVista的创始人进行了一项实验[Graph structure in the Web - ScienceDirect
]，以探索Web的形状。论文抛出了一个问题：给定一个节点 $v$ ,这个节点可以到达哪些节点；有哪些其他节点可以访问到这个节点 $v$ ？

这样会就产出两种类型的节点：
$In(v)= \{ w | w \quad can \quad reach \quad v \}$

$Out(v)= \{ w | v \quad can \quad reach \quad w \}$

上面两个集合可以通过运行简单的BFS来遍历得到。例如，在下图中

In(v)= \{ A，B，C，E，G \}

$Out(v)= \{ A，B，C，D，F \}$

有向图的更多细节

有向图有两种类型：

强连通图：任何节点都可以访问到任何其他节点的图。
有向无环图（DAG）：在图论中，如果一个有向图从任意顶点出发无法经过若干条边回到该点，则这个图是一个有向无环图（DAG, Directed Acyclic Graph）。

任何有向图都可以表示为这两种类型的组合，可以通过以下两个步骤实现：

** 获取有向图中的强连通图**
将SCC合并到超节点中，创建一个新图形G’

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

在Avalonia中，如何移除高度的值，使其为NaN

MainBody.Height = double.NaN;//移除該屬性值這樣就能自適應高度了

2024-04-30 14:27:14

nginx反向代理与证书设置

server { listen 443 ssl; server_name your.domain.com; ssl_certificate /path/to/certificate.crt; ssl_ce

2024-04-30 14:25:14

免费证书certbot-aliyun

FROM certbot/certbot RUN pip install certbot-dns-aliyun docker build -t certbot-aliyun . # Aliyun DNS credentials

2024-04-30 14:25:14

通过Http链接地址爬取有赞微信商城商品信息及下载至EXCEL

一、環境開發環境： Microsoft Visual Studio Professional 2022 (2) (64 位) - Current版本 17.7.7 .net core 6.0 AngleSharp 1.1.2 AngleS

2024-04-30 14:22:03

多人同时导出 Excel 干崩服务器！新来的阿里大佬给出的解决方案太优雅了！

來源：juejin.cn/post/7259249904777838629 前言業務訴求：考慮到數據庫數據日漸增多，導出會有全量數據的導出，多人同時導出可以會對服務性能造成影響，導出涉及到mysql查詢的io操作，還涉及文件輸入、輸出流的

2024-04-30 14:21:33

golang将uint32与byte[]互转

package main import ( "encoding/binary" "fmt" ) func main() { // 一個長度爲4的byte切片，表示一個負數 bytes := []byte{0xFF, 0xFF,

藍天上的雲℡

2024-04-30 14:21:33

Linux内核源码-存储驱动之 QSPI Flash

傳輸方式 DIO/QIO/DOUT/QPI QPI模式(Quad Peripheral Interface)，所有階段都通過4線傳輸。與之相對的是SPI。 SPI模式：純種SPI(MISO/MOSI兩個數據線) DOUT 全稱 Dua

藍天上的雲℡

2024-04-30 14:21:33

一个园上面点3个点, 成钝角三角形概率多大?

答案1/4 要有數學上的順序的概念.

張博的博客

2024-04-30 14:20:03

python找不到自己的写的库包或者文件

import sys sys.path.append('../..') sys.path.append('.') sys.path.append('./') 把這些路徑都加入sys.path就找到了.

張博的博客

2024-04-30 14:20:02

符文Runes协议技术详解

最近符文Runes協議是比特幣生態最火的項目，於是我利用晚上的時間，把Runes協議使用Go語言實現了一遍，項目地址：https://github.com/bxelab/runestone，另外也基於這個Runestone庫編寫對應的一個命

2024-04-30 14:18:02

《最新出炉》系列入门篇-Python+Playwright自动化测试-41-录制视频

1.簡介上一篇講解和分享了錄製自動生成腳本，索性連帶錄製視頻也一股腦的在這裏就講解和分享了。今天我們將學習如何使用Playwright和Python來錄製瀏覽器操作的視頻，以便在需要時進行回放和分析。 2.錄製視頻語法錄製視頻介紹官方A

2024-04-30 14:14:41

MFC文本设置字体发虚的问题

MFC 文本設置字體發虛的問題最近在做一項目中，發現默認的字體比較正常，字體如下：字體比較清晰，在代碼加入如下設置字體項後，反而顯示發虛，模糊 CFont * m_font= new CFont; m_font->CreatePoin

2024-04-30 14:13:31

算法~利用zset实现滑动窗口限流

滑動窗口限流滑動窗口限流是一種常用的限流算法，通過維護一個固定大小的窗口，在單位時間內允許通過的請求次數不超過設定的閾值。具體來說，滑動窗口限流算法通常包括以下幾個步驟：初始化：設置窗口大小、請求次數閾值和時間間隔。維護窗口：將請求

2024-04-30 14:12:40

springboot~AutoConfigureAfter如何控制Bean的注入顺序

這個文章主要介紹一下@AutoConfigureAfter在spring框架中的作用，在使用過程中，很多開發人員在使用它的時候都出現了問題，問題比較多的就是它們的註冊順序總不是我們預期的，下面介紹一下正常的使用方法。 @AutoConfi

2024-04-30 14:12:40

java~graalVM虚拟机

GraalVM GraalVM 是一種高性能、通用的虛擬機，由 Oracle 公司開發。它支持多種編程語言（如 Java、JavaScript、Python 等），並提供了即時編譯器、AOT 編譯器等功能。GraalVM 的主要特點包括：

2024-04-30 14:12:40

24小時熱門文章

最新文章

最新評論文章