《AutoRec: Autoencoders Meet Collaborative Filtering》
目的:利用AE來預測用戶對物品missing的評分值。
論文信息:WWW 2015。
一,Contribution:
1)提出一種新的深度學習模型AutoRec,將CF和AE結合,實驗證明在RMSE指標數上優於CF和RBM等模型。
二, 實驗:
我們提出一種混合的協同過濾推薦系統模型與AE,首將AE拿來直接學習Rating Matrix裏的行或列數據的壓縮向量表達,分爲user-based AutoRec和item-based AutoRec兩種。
本文實驗數據集:MovieLens- Movielens 1M, 10M and Netflix。
2.1本文模型:
如上圖所示:上圖爲一個item-based AutoRec。一個AE模型,。
輸入:
R裏的每列,即每個item用各個user對它的打分作爲其向量描述。
模型目標:
後一項爲防止過擬合加入的正則項。需要注意的是第一項裏在計算loss只在觀測到的數據上計算。未觀測到的missing value在初始時賦一個默認值,比如1-5分的打分體系裏統一給3。
輸出:
在使用模型做預測時,直接將模型對input重建後的新向量裏對應位置的值認爲是預測值,即
2.2 實驗結果
從實驗數據來看,item-based AutoRec勝出user-based AutoRec,比傳統的FM類方法都要更好。
(這可能是由於每個項目評分的平均數量是高於每個用戶的輸入評分數;用戶評分數量的高方差導致基於用戶的方法的預測不可靠。)
2.3 改進方向
在數據很稀疏的情況下用AE去學習的效果會不理想,數據裏噪聲太大,在CF裏存在的困境同樣存在。DL+CF的文章中引入了item和user的side information去解決這個問題。