【論文學習】基於內容和用戶偏好學習的個性化商品推薦模型(浙江大學計算機科學碩士畢業論文)bpr模型

基於內容和用戶偏好學習的個性化商品推薦模型(浙江大學計算機科學碩士畢業論文)bpr模型


文章鏈接:待上傳

一、主要貢獻

(1)提出一種基於內容的混合採樣策略的BPR改進算法BPRConBPR_{Con}
現有算法沒有考慮噪聲樣本對模型準確率和收斂速度的影響,這裏考慮商品對信息值、商品信息以及用戶潛在喜好三個因素進行模型訓練。
(2)提出一種基於內容和用戶偏好學習的個性化商品推薦算法ConSetBPR
提出一種基於內容和用戶偏好學習的個性化商品推薦算法,利用異構隱式反饋、商品信息以及用戶網購行爲特點對用戶偏好定義,爲用戶偏好添加相應置信度,並將BPRConBPR_{Con}採用策略結合到模型中盡心推薦。
實驗結果表明模型能夠達到更高的推薦精度以及更穩定快速的收斂狀態。

二、相關工作

2.1 基於隱式反饋的推薦算法

隱式反饋中只有 戶有/ 爲的 元數據,所以 基於單物品的協同過濾算法 先要解決的就是如何從 元的隱式反饋數據中挖 掘出 戶的 同偏好程度。爲 解決這個問題, 種最簡單的 式就是將所有 戶沒有過 爲的 戶.物品對當成負反饋[^8](All MissingAs Negative,AMAN)。 這種 方式假設用戶只會對物品總量中的小部分感興趣,即在用戶沒有行爲的物品 中,絕大多數的確是 戶不感興趣的負反饋樣本。但這種處理方式未考慮到:第 一,用戶沒有過行爲的物品中可能夾雜着一部分用戶感興趣的物品;第二,用戶行爲矩陣過大導致算法計算複雜度過大。
針對上述問題,基於單物品的協同過濾主要通過兩種 式來解決:
1 ) 樣本置信度。
Hu等人[^9]針對視頻
推薦網站,根據 戶觀看頻率爲每個樣本添加預先定義好的置信度。於是他們將觀看 頻率作爲樣本置信度的衡 標準,爲每個樣本添加置信度cui=1+αruic_{ui} = 1 + \alpha*r_{ui}。其中α\alpha是根據場景調整的參數,然後利用矩陣分解模型預測的用戶u對視頻i的偏好R^ui\hat{R}_{ui}.模型的損失函數爲:
在這裏插入圖片描述
第二種思路是爲缺失樣本添加相應權 。Pan[^8]等人通過構造樣本權重矩陣W。對所有用戶的正反饋樣本賦予權重WijW_{ij}=1 ,對於缺失樣本,他們定義 3種不同的負反饋樣本權重分佈:

  • 隨機分佈:對於一個缺失樣本,它對所有用戶而言是負反饋樣本的可能性完全一致。
  • 面向用戶的分佈:對於一個缺失樣本中的用戶u,如果u對很多物品又過消費行爲,那麼他沒有過行爲的物品時負反饋樣本的可能性越大.
  • 面向物品的分佈:對於一個缺失樣本中的物品i,如果i杯很少的用戶有過行爲,那麼它是負反饋樣本的可能性越大。
    2)負樣本採樣策略
    通過不同負反饋樣本採樣分佈爲用戶選取出合適的負反饋樣本,再與用戶的正反饋樣本一起構建用戶-物品訓練矩陣,從而利用傳統協同過濾技術進行推薦。
    Pan[^8]等人提出了三種負反饋樣本採樣分佈:
  • 隨機分佈:從該用戶沒有過行爲的物品中均勻的採樣出部分物品作爲負反饋樣本
  • 面向用戶的分佈:從該用戶沒有過行爲的物品中採樣出與正樣本數量相當的物品作爲負反饋樣本。如果一個用戶時活躍用戶,那麼他沒有過行爲的物品是負反饋樣本的可能性越大。
  • 面向物品的分佈:從該用戶沒有過行爲的物品中採樣出那些不熱門的物品作爲負樣本。一個物品越不流行,那麼這個物品時沒有過行爲的用戶的負反饋樣本的可能性更大。

2.2 基於物品對的協同過濾算法

2.2.1 bpr基本框架結構

看另外一個blog

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章