基於內容的推薦算法

基於內容的推薦算法本質是對內容進行分析,建立特徵。
物品都有一些關於內容的分類,基於內容的分類,就是根據這些物品的內容屬性和用戶的歷史評分或操作記錄,計算出用戶對不同內容屬性的愛好程度,再根據這些愛好推薦其他相同屬性的物品。

內容推薦的方法可歸納爲3個步驟:
1.特徵提取:提取每個待推薦物品的特徵,內容屬性,例如電影的特徵。
2.用戶偏好計算:利用一個用戶過去的顯式評分或隱式操作記錄,計算用戶不同特徵上的偏好分數。
3.內容召回:將待推薦物品的特徵與用戶偏好得分匹配,取出用戶最優可能喜歡的物品池。
4.物品排序:按用戶偏好召回物品池,可能一次性挑選出很多物品,可以進一步對這些物品排序。

優點:
1.物品沒有冷啓動問題,因爲物品的內容特徵不依賴於用戶數據,同時推薦出的物品不會存在過於熱門的問題
2.能爲具有特殊興趣的用戶進行推薦
3.原理簡單

物品的特徵通常分爲兩類:
結構化特徵:特徵的取值限定在某個區間範圍內,可按照定長的格式來表示。
非結構化特徵:無法按固定格式表示,最常見的是文章。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章