推薦系統(1)——推薦系統概述

本文主要介紹常見的商品推薦方法推薦系統的評價指標

1.推薦系統概述

推薦系統是主動從大量信息中找到用戶可能感興趣的信息的工具。推薦系統的核心問題是如何實現推薦個性化如何向用戶推薦匹配度高的產品(商品)或項目,本質是通過一定的方式將用戶項目聯繫起來。

自從Xerox Palo Alto研究中心於1992年研發出了基於協同過濾的實驗系統Tapestry以來(主要功能:利用用戶的顯式反饋(評分和註釋),幫助用戶過濾郵件,解決郵件過載問題。),隨着互聯網、移動技術發展,推薦系統得到了快速的發展,已經滲透到了人們的衣食住行中。

推薦系統針對不同的服務對象,可以分爲基於全體用戶的推薦基於單個用戶的推薦(即個性化推薦)。以電子商務爲例,基於全體用戶的推薦,是對所有消費者給出同樣的推薦,如根據物品流行度計算的top-k個項目,推薦給所有用戶。基於單個用戶的推薦,是針對不同的用戶給出不同的推薦結果,如根據單個用戶的行爲記錄,推測用戶的喜好,從而做出一對一的推薦

根據推薦系統使用數據源的不同,可以將推薦系統分爲以下幾類(分類標準源自參考文獻1):

(1)基於用戶行爲數據的推薦

(2)基於項目內容數據的推薦

(3)基於社交網絡數據的推薦

(4)基於語境感知的推薦

(5)基於人口統計學數據的推薦

(6)基於心理學數據的推薦

(7)基於大數據的推薦

上述幾類推薦算法都有它的優勢和不足之處,如基於用戶行爲數據的推薦不需要領域知識,只需要收集用戶行爲數據即可進行推薦,但存在冷啓動問題(cold-start)基於人口統計學的推薦不需要用戶的歷史行爲數據,能夠很好地解決冷啓動問題,但年齡、性別等人口統計學數據比較難以獲取,並且推薦的粒度很粗(大多是針對某一類人羣),單獨使用無法事先完全的個性化推薦。有關上述推薦算法的優缺點詳細分析,如下圖所示:

這裏寫圖片描述

2.常見的商品推薦方法

上面主要是從整體的角度介紹了下推薦系統算法的分類,下面重點介紹在電商領域常用的商品推薦方法及其優缺點和應用案例

(1) 基於商品相似度的推薦:比如食物A和食物B,對於它們價格、味道、保質期、品牌等維度,可以計算它們的相似程度,如買了包子,很有可能順路帶一盒水餃回家。
優點:只要有商品的數據,在業務初期用戶數據不多的情況下,也可以做推薦
缺點:預處理複雜,任何一件商品,有成百上千的維度,如何選取合適的維度進行計算是難題。
典型亞馬遜早期的推薦系統

(2)基於關聯規則的推薦:最常見的就是通過用戶購買的習慣,經典的就是“啤酒尿布”的案例,首先要做關聯規則,數據量一定要充足,否則置信度太低,當數據量上升了,業內的算法有Apriori、FP-Growth等。
優點:簡單易操作,上手速度快,部署起來也非常方便
缺點:需要有較多的數據,精度效果一般
典型:早期運營商的套餐推薦

(3)基於物品的協同推薦:假設物品A被小張、小明、小董買過,物品B被小紅、小麗、小晨買過,物品C被小張、小明、小李買過;直觀的看來,物品A和物品C的購買人羣相似度更高(相對於物品B),現在我們可以對小董推薦物品C,小李推薦物品A。
優點:相對精準,結果可解釋性強,副產物可以得出商品熱門排序
缺點:計算複雜,數據存儲瓶頸,冷門物品推薦效果差
典型:早期一號店商品推薦

(4)基於用戶的協同推薦:假設用戶A買過可樂、雪碧、火鍋底料,用戶B買過衛生紙、衣服、鞋,用戶C買過火鍋、果汁、七喜;直觀上來看,用戶A和用戶C相似度更高(相對於用戶B),現在我們可以對用戶A推薦用戶C買過的其他東西,對用戶C推薦用戶A買過買過的其他東西。

(5)基於模型的推薦:常用的方法有svd+特徵值分解等,將用戶的購買行爲的矩陣拆分成兩組權重矩陣的乘積一組矩陣代表用戶的行爲特徵一組矩陣代表商品的重要性,在用戶推薦過程中,計算該用戶在歷史訓練矩陣下的各商品的可能性進行推薦
優點精準,對於冷門的商品也有很不錯的推薦效果
缺點計算量非常大,矩陣拆分的效能及能力瓶頸一直是受約束的
典型:惠普的電腦推薦

(6)基於時序的推薦:主要應用於Twitter,Facebook,豆瓣這樣的社交網站,比如說在只有贊同和反對的情況下,怎麼進行評論排序。

(7)基於深度學習的推薦:現在比較火的CNN(卷積神經網絡)RNN(循環神經網絡)DNN(深度神經網絡)都有運用在推薦上面的例子,但是都還是試驗階段,相對比較成熟的有基於word2vec的方法
優點:推薦效果非常精準,所需要的基礎存儲資源較少。
缺點:工程運用不成熟,模型訓練調參技巧難。
典型:蘇寧易購的會員商品推薦

3.推薦系統評價指標

常見的推薦系統評價指標如下圖所示:

這裏寫圖片描述

Reference:
[1]朱楊勇.孫婧.推薦系統研究進展[J]。計算機科學與探索,2015,9(5):513-525
[2]深度學習在電商商品推薦中的應用 (http://www.afenxi.com/post/47739)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章