初識推薦引擎

推薦引擎是數據應用的經典例子,典型的應用場景如亞馬遜的商品推薦。

根據推薦引擎的數據源分類可分爲三種:

  • 根據系統用戶的基本信息發現用戶的相關程度,這種被稱爲基於人口統計學的推薦(Demographic-based Recommendation)
  • 根據推薦物品或內容的元數據,發現物品或者內容的相關性,這種被稱爲基於內容的推薦(Content-based Recommendation)
  • 根據用戶對物品或者信息的偏好,發現物品或者內容本身的相關性,或者是發現用戶的相關性,這種被稱爲基於協同過濾的推薦(Collaborative Filtering-based Recommendation)。

基於人口統計學的推薦:

簡單來說就是對用戶建模、打標籤,假設用戶A的標籤和用戶B的標籤相同,那麼可以認爲用戶A和用戶B有相同喜好,然後把用戶B喜愛的項目推薦給用戶A。

基於內容推薦:

對內容或者項目進行建模和打標籤,有相同標籤的內容歸屬同一類,例如電影A和電影B都有“動作片”標籤,那麼它們是同一類,當用戶A看過電影A,那麼就給他推薦電影B。

基於協同過濾推薦:

協同過濾又分爲:

基於用戶的協同過濾推薦:這個有點類似人口統計學的推薦,區別在於協同過濾計算用戶的相似度,然後利用K-鄰居算法把K鄰居的商品推薦給目標用戶。

基於項目的協同過濾推薦:這個和基於內容推薦都是根據內容的,但這個會計算相似度,例如用戶A喜歡物品A、B和C,用戶B喜歡物品A,用戶C喜歡物品A和C,那麼系統任務物品A和C是相似的,那麼系統給用戶B推薦物品C。

基於模型的協同過濾推薦:訓練樣本用戶數據,建立模型,根據模型進行實時推薦。

參考資料:

https://www.ibm.com/developerworks/cn/web/1103_zhaoct_recommstudy1/index.html

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章