推薦系統實踐-閱讀筆記4

一. 隱語義模型

latent factor model
算法理論
對於某個用戶,首先得到他的興趣分類,再從分類中挑選他可能喜歡的物品
基於用戶行爲的自動聚類
P83 迭代優化P Q兩個參數
(負樣本採集問題: 熱門商品卻沒有被用戶喜歡的商品作爲該用戶的負樣本)
重要的參數有:
1.隱藏的特徵個數F
2.學習速率alpha
3.正則化參數lamba
4.負樣本/正樣本比例ratio
缺點:
雅虎的首頁推薦。很難做到實時推薦,因爲需要反覆的迭代
e.g. 新聞推薦的冷啓動問題非常明顯

#二. 基於二分圖的模型
一邊的節點是用戶,一邊的節點是物品。連接邊代表兩者之間有聯繫
相關性評價指標:
1.兩個頂點之間很多路徑相連
2.兩個頂點之間的路徑長度比較短
3.兩個頂點之間的路徑不經過出度比較大的頂點 (避開用戶活躍度高 或者 熱門的商品)
隨機遊走的personalRank
P92
==> 矩陣形式的PersonalRank
P94

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章