推薦系統 recommender system

原創

2018-12-23 16:47

使用場景

消費者 $C=\{user_1,user_2,user_3,\dots,user_{n_u}\}$ ,一共有 $n_u$ 個樣本

商品 $G=\{prod_1,prod_2,\dots,prod_{n_p}\}$ ,一共有 $n_p$ 個樣本

消費者對商品的評分如下表：

	$user_1$	$user_2$	$user_3$	$\dots$	$user_{n_u}$
$prod_1$	$r_{1,1}$	$r_{1,2}$	$r_{1,3}$	$\dots$	$r_{1,n_u}$
$prod_2$	$r_{2,1}$	$r_{2,2}$	$r_{2,3}$	$\dots$	$r_{2,n_u}$
$\dots$
$prod_{n_p}$	$r_{n_p,1}$	$r_{n_p,2}$	$r_{n_p,3}$	$\dots$	$r_{n_p,n_u}$

描述商品i在某特徵的符合程度 $x_i=[f_1,f_2,\dots,f_m]^T \quad(m \times 1)$
消費者j對某個特徵的喜好程度 $\theta_j=[\theta_1,\theta_2,\dots,\theta_m]^T \quad (m\times 1)$

特徵的維數m將會在後面說到。

對於某個商品i，消費者j對其評分 $r_{i,j}$ 由 $x_i,\theta_j$ 來決定，即
$r_{i,j}=\theta_j^Tx_i$

協同過濾算法

協同過濾算法的思想是對某種特徵的喜好相同(比如都喜歡動作電影)的消費者，對在某種特徵上比較契合的商品上評價也應趨於一致(對於新出的動作電影評分都可能較高)

設置 $m$ 個特徵， $f_1,f_2,\dots,f_m$ ,比如電影的浪漫程度，暴力程度，喜劇程度等等，這些特徵不用手工提取，只需要確定m的大小，特徵的具體值將會由算法學習得出。
對於 $n_u$ 個消費者， $n_p$ 個商品，我們先初始化兩個數據集：

$X=\{x_1,x_2,\dots,x_{n_p}\}$

$\Theta=\{\theta_1,\theta_2,\dots,\theta_{n_u}\}$

隨機賦一些較小的值。

協同過濾算法的基本思路是：同時優化 $X,\Theta$ ，優化目標如下：

$J(x_1,\dots,x_{n_p},\theta_1,\dots,\theta_{n_u})=\frac{1}{2}\sum_{(i,j):r(i,j)=1}(\theta_j^Tx_i-y_{i,j})^2+\frac{\lambda}{2}\sum_{i=1}^{n_p}\sum_{k=1}^{m}(x_i^{k})^2 +\sum_{j=1}^{n_u}\sum_{k=1}^m(\theta_j^k)^2$
注意，這時候就不需要加上恆爲1的偏差（如之前的 $x_0=1,\theta_0=1$ )，這時 $x \in \mathbb{R}^m,\theta \in \mathbb{R}^m$

使用梯度下降等方法進行優化，對 $i=1,2,\dots,n_p;j=1,2,\dots,n_u;k=1,2,\dots,m$ ：
$x_i^k=x_i^k-\alpha(\sum_{j:r(i,j)=1}(\theta_j^Tx_i-y_{i,j})^2 +\lambda_i^k)\\ \theta_j^k=\theta_j^k-\alpha(\sum_{i:r(i,j)=1}(\theta_j^Tx_i-y_{i,j})^2 +\lambda_i^k)$

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

推薦系統 recommender system

使用場景

協同過濾算法

druid數據源 xml配置

Windows下C++使用thread時無法識別thread和mutex相關庫的解決

DNS新記錄插入圖解和總結

TCP擁塞控制總結圖

MATLAB 實現zigzag掃描（z字形掃描）

LeetCode 2：Add Two Numbers解題

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結