推薦系統筆記二 Personal rank算法

原創

thormas1996

2020-06-16 12:01

Graph-based推薦傳統做法是構建二元圖（bipartite），分爲user和item兩個node集合，user-item的interaction構建兩個集合之間的連線，見下圖，其中圓框是三個user，方形框是四個item。

該方法在2005年前較流行，現在學術界更流行的方法是Graph Convolutional Network(GCN)。

推薦採用personal rank算法，或者說random work，與page rank思路是一樣的。首先從一個頂點（即某一user A）出發，以一定概率 $\alpha$ 往下一個節點遊走，以 $1-\alpha$ 概率回到初始頂點A，足夠長時間後，整幅圖的概率分佈會趨於一個穩定值，這個概率值即爲該user A對每個item的感興趣程度。

舉個例子：
假定從A出發，一開始 ${PR(A) = 1}$ ，其餘爲0
第一步，A以 $\frac{1}{2} \times \alpha$ 概率分別向a、c遊走，
$PR(A) = 1-\alpha \\ PR(a) = PR(c) = \frac{1}{2} \times \alpha$
第二步，A以 $\frac{1}{2} \times \alpha$ 概率分別向a、c遊走，a以 ${\frac{1}{2} \times \alpha}$ 概率分別向A、B遊走，c以 ${\frac{1}{3} \times \alpha}$ 概率分別向A、B、C遊走

$\begin{aligned} PR(A') = &PR(A) \times (1-\alpha) + PR(a) \times \frac{1}{2} \alpha + PR(c) \times \frac{1}{3} \alpha + \\ &PR(a) \times (1-\alpha) + PR(c) \times (1-\alpha) \\ =&1-\alpha + \alpha \times \frac{PR(a)}{2} + \alpha \times \frac{PR(c)}{3} \\ \end{aligned} \\ \begin{aligned} PR(a') &= PR(A) \times \frac{1}{2} \alpha \\ &= \alpha \times \frac{PR(A)}{2} \end{aligned} \\ \begin{aligned} PR(c') &= PR(A) \times \frac{1}{2} \alpha \\ &= \alpha \times \frac{PR(A)}{2} \end{aligned} \\ PR(B') = \frac{1}{2} \alpha \times PR(a) + \frac{1}{3} \alpha \times PR(c) \\ PR(C') = \frac{1}{3} \alpha \times PR(c)$
以此類推可以得到每步的更新公式：
$PR(j)=\left\{ \begin{aligned} & \alpha \times \sum_{i \in in(j)} \frac{PR(i)}{|out(i)|} \quad if\ (j \neq u)\\ & (1-\alpha) + \alpha \times \sum_{i \in in(j)} \frac{PR(i)}{|out(i)|} \quad if\ (j = u) \end{aligned} \right.$
其中 ${in(j)}$ 表示指向j的結點的集合， ${out(j)}$ 表示j指向的結點的集合， ${|out(j)|}$ 表示j指向的結點的數目，u表示初始的頂點，即需要推薦的用戶

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

推薦系統筆記二 Personal rank算法

芯片產業管理和營銷指北（1）—— 產品線經理主要職能

記一次疑似JVM內存泄漏的排查過程

推薦系統筆記二 Personal rank算法

強化學習筆記三 Monte Carlo Method & Temporal-Difference Method

Latex公式編輯

調參筆記：神經網絡收斂問題

推薦系統論文閱讀 Why Does Collaborative Filtering Work?

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結