請聊聊你所瞭解的推薦系統算法

推薦系統算法如果根據推薦的依據進行劃分,有如下三大類算法:

一、Content-based recommenders:推薦和用戶喜歡的商品相似的商品。主要是基於商品屬性信息和用戶畫像信息的對比。核心問題是如何刻畫啊商品屬性和用戶畫像以及效用的度量。方法包括:

1.1 Heuristic-based method:對於特徵維度的構建,例如基於關鍵字提取的方法,使用IF-IDF等指標提取關鍵字作爲特徵。對於效用的度量,例如使用啓發式cosine相似性指標,衡量商品特徵和用戶畫像的相似性,相似性越高,效用越大。

1.2 Machine learning-based method:對於特徵維度的構建,使用機器學習算法來構建用戶和商品的特徵維度。例如建模商品屬於某個類別的概率,得到商品的刻畫屬性。對於效用的度量,直接使用機器學習算法擬合效用函數。

二、Collaborative recommenders:推薦和用戶有相似品味和偏好的用戶喜歡過的商品。主要是基於用戶和商品歷史交互行爲信息,包括顯示的和隱式的。協同過濾方法進一步細分爲:
 

2.1 Memory-based CF:基於內存的協同過濾方法:直接對User-item矩陣進行研究。通過啓發式的方法進行推薦。核心要素包括相似性度量和推薦策略。相似性度量包括Pearson或Cosine等;而最簡單的推薦方法是基於大多數的推薦策略。

User-based Cf:推薦給特定用戶列表中還沒有發生過行爲、而在相似用戶列表中產生過行爲的高頻商品。

Item-based CF:推薦給特定用戶列表中還沒有發生過行爲、並且和已經發生過行爲的商品相似的商品。

 

2.2 Model-based CF:基於模型的協同過濾方法。主要是運用機器學習的思想來進行推薦。主要包括:

基於流行學習的矩陣降維/分解算法:SVD、FunkSVD、BiasSVD、SVD++、NMF等

基於表示學習的深度學習算法:MLP、CNN、AutoEncoder、RNN等

基於圖/網絡模型的算法:MDP-based CF、Bayesian Belief nets CF、CTR(協同主題迴歸,將概率矩陣分解和主題模型結合應用於推薦系統)等。

其它:包括基於聚類的CF、稀疏因子分析CF、隱語義分析CF等等

 

2.3 Hybrid CF:結合多種方式的CF算法。如Content-based CF、Content-boosted CF或者結合memory-based和Model-based CF混合方法。

 

三、Hybrid approaches:混合方法。綜合集成上述兩種方法。

當前推薦算法主要是基於內容(CB)、協同過濾(CF)、混合算法。基於內容的推薦依靠用戶profile和item的描述做推薦。CF基於過去的表現和行爲推薦。由於種種原因,收集過去的行爲比收集用戶畫像要容易,但CF又有他的侷限性,當打分(rating)很稀疏時,預測精度會下降很厲害,同時,新產品的冷啓動也是CF的問題。因此,近年來,混合方法應用比較廣。

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章