推薦系統-冷啓動方案

最近調研了一些冷啓動方案,現彙總如下

商品冷啓動

商品冷啓動一般在item的embedding上優化

Graph Embedding

在Graph Embedding I2I的基礎上,加入商品的Side Information,進一步提升Embedding的泛化學習能力,更好地解決長尾以及商品冷啓動問題

《Hybrid Item-Item Recommendation via Semi-Parametric Embedding》

前言

2019 IJCAI (阿里機器智能技術和優酷人工智能平臺)

本文提出了一種半參表示框架, 它結合商品的行爲信息和內容信息,以達到在維持行爲豐富 item 上表現的同時,緩解新發商品上的冷啓動問題。另外本文引入 sDAE 來幫助學習更強力的內容表示,以達到更魯棒的效果。3 個真實數據集、3類對比推薦算法、4 種評價指標上的對比實驗,驗證了該算法的可靠性和魯棒性。

半參向量表示(SPE)

同時使用行爲和內容信息來建模商品表示:,其中, v 爲商品的向量表示; z 爲商品的行爲信息表示部分, 每個商品的行爲表示各自不同; e 爲內容信息表示部分, 通過特徵輸入得到, c 爲商品的內容輸入向量(商品的文本、描述、類目等); δ 爲兩者之間的權重大小, 由當前item上的歷史統計信息(商品曝光、點擊次數等)決定。若當前item行爲豐富, δ較大, 最終的向量由z主導; 而新品 item 行爲信息少, δ 較小,模型對行爲信息的權重加大。

行爲向量 z 和內容向量 e 分別爲模型中非參數化向量和參數化向量, 結合兩者,作者將其稱作半參向量表示。相似度計算:,爲了學習更魯棒的內容向量表示,對參數化向量表示,引入深度學習中的多層降噪自動編碼機(stacked denoise autoencoder, sDAE)。

Stacked and Reconstructed Graph Convolutional Networks for Recommender Systems

2019 IJCAI  ?star-gcn.pdf

作者提出了一個圖卷積網絡(STAR-GCN)架構,用於學習節點表示,以提高推薦系統的性能,特別是在冷啓動場景中。 STAR-GCN採用了一疊GCN編碼器 - 解碼器以對中間過程進行監督來改進最終的預測效果。與one-hot編碼節點輸入的圖卷積矩陣完成模型不同,STAR-GCN學習低維用戶和商品隱變量作爲輸入來限制模型空間的複雜性。此外,STAR-GCN可以通過重構masked的輸入節點embedding爲新節點生成節點embedding,這本質上解決了冷啓動問題。

 

用戶冷啓動

社交網絡挖掘好友

當一個新用戶通過微博或者Facebook賬號登錄網站時, 我們可以從社交網站中獲取用戶的好友列表,然後給用戶推薦好友在網站上喜歡的物品。 從而我們可以在沒有用戶行爲記錄時就給用戶提供較高質量的推薦結果,部分解決了推薦系統的冷啓動問題。

《DropoutNet: Addressing Cold Start in Recommender Systems》

nips2017    鏈接

【背景】

要處理冷啓動問題,我們必須使用content信息。但是想要整個系統的推薦效果較好,我們也必須使用preference信息。目前最好的方法,就是二者結合形成的Hybrid方法,但是往往有多目標函數,訓練複雜。

如何把contentpreference的信息都結合起來,同時讓訓練過程更簡單?

針對冷啓動問題,本文不是引入額外的內容信息和額外的目標函數,而是改進整個學習過程,讓模型可以針對這種缺失的輸入來訓練。

基於鄰居用戶特徵映射的跨領域推薦

鏈接

  • 找到目標用戶的最近鄰用戶(輔助領域中有相似評分行爲的用戶)
  • 使用鄰居用戶的潛在特徵來學習潛在特徵映射函數
  • 基於映射函數和目標用戶在輔助領域的潛在特徵來預測其在目標領域的特徵,從而生成推薦

 

Crowd-based Filtering

基於人羣屬性來推薦的方法,其通過將用戶按照性別、年齡段、收貨城市等粗粒度的屬性劃分爲若干個人羣,然後爲基於每個人羣的行爲數據挑選出該人羣點擊率高的TopK個商品作爲該人羣感興趣的商品。(hot的基礎上劃分group)

Attribute2I

鏈接

將用戶的靜態屬性(年齡、性別、常住地、LBS位置)以及寶貝的特徵融合進來,對商品打分。

將用戶的各種屬性組合起來作爲一個Key(比如:F_19-25_1_N_UNK_北京市),然後去檢索,新增一種召回類型。

 

以下幾個方案思想一致:先推幾個商品,根據這幾個商品去判斷用戶偏好

基於代表性(2017)

使用有代表性的項目和用戶子集,即依賴那些能夠“代表”項目和用戶的用戶。代表性用戶的興趣偏好線性組合能與其他用戶的無限接近。例如,基於代表性的矩陣因子分解(RBMF,Representative Based Matrix Factorization),其實是矩陣因子分解方法的擴展,其附加約束條件是m個項應該由k個項的線性組合表示,如下面的目標函數所示:

當新用戶進入平臺時,要求新用戶對這k個項進行評級,並用它來推斷其他m-k項的評級。

Bandit算法

多臂老虎機

MeLU: Meta-Learned User Preference Estimator for Cold-Start Recommendation 

KDD 2019

本文提出了一種新的推薦系統,解決了基於少量樣本物品來估計用戶偏好的冷啓動問題。爲了確定用戶在冷啓動狀態下的偏好,現有的推薦系統,如Netflix,最初向用戶提供商品;我們稱這些物品爲候選證據。然後根據用戶選擇的物品提出建議。以往的推薦研究有兩個侷限性:(1)消費了少量商品的用戶推薦不佳,(2)候選證據不足,無法識別用戶偏好。爲了克服這兩個限制,我們提出了一種基於元學習的推薦系統MeLU。從元學習中,MeLU可以通過幾個例子快速地採用新任務,通過幾個消費項來估計新用戶的偏好。此外,我們提供了一個證據候選選擇策略,以確定自定義偏好估計的區分項目。我們用兩個基準數據集對MeLU進行了驗證,與兩個比較模型相比,該模型的平均絕對誤差至少降低了5.92%。我們還進行了用戶研究實驗來驗證證據選擇策略。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章