爲畢設🐎一下 , 應該能用到 戳 原文
用戶推薦算法,能夠通過數學變量的運算,推測出用戶可能喜歡的東西。在信息化社會的今天,優秀的推薦算法無疑降低了用戶尋找優質內容的成本,同時也給廣告定點推薦提供了良好的解決方案。
使用不同的產品,可以發現,推薦系統是給各大平臺培養用戶粘性的必備功能。比如,微博根據你關注的用戶推薦相似你可能感興趣的用戶,蝦米音樂使用“音樂基因”的方式推薦音樂,網易雲音樂也提供歌曲每日推薦的服務,淘寶等電商平臺則根據用戶的購買記錄,瀏覽記錄實時推薦潛在的商品,知乎平臺使用主題標籤推薦內容,各大互聯網新聞平臺也提供實時準確的新聞推送,美團根據食客的評級推薦美食。
本篇綜述將從推薦算法的作用,種類,效果評估,改進等,四個方面進行論述。
通過深入使用不同的平臺,我發現推薦系統有如下作用:
推薦算法作用
能夠高效的幫助用戶找到需要的商品或服務
互聯網時代的商品從線下延伸到線上,使得商品的選擇成指數級增長。用戶往往在選擇時,耗費大量的時間、精力。不過,使用推薦系統的平臺,能夠有效避免這方面的問題,同時,增加平臺的收益。
去處信息噪聲
隨着互聯網的發展,網絡每時每刻都在生產巨量的信息。個人用戶要在浩如煙海的互聯網尋找有價值的信息,是極其困難的。但是,推薦系統能夠幫助用戶過濾低價值的信息。
對於互聯網平臺而言,提高了收益率和培養了用戶粘性
觀察中國的互聯網環境,用戶對內容的要求越來越高。低質量的內容輸出,已經滿足不了用戶的日常閱讀需求。推薦系統則努力迎合用戶的需求,秉承用戶至上的原則。
爲廣告業帶來了機遇
在觀看愛奇藝視頻的時候,屏幕左下方經常出現男女主人公同款,電視劇商品同款等廣告。貼片廣告,實現了實時推薦,極大的提高了廣告主的收益,同時,提高了用戶的觀看體驗,附加體驗。
在當今的互聯網環境下,推薦系統的作用,被越來越多的企業所重視。各大企業也依據業務需求,開發了自己的推薦系統。無論推薦系統最終呈現出怎樣的效果,他們都是基於以下幾類基本的推薦算法。
推薦算法分類
基於流行度的推薦算法
基於流行度的推薦算法是最簡單的推薦算法。比如,微博根據新聞/事件的瀏覽量,評論量等大數據進行內容排序,從而將排名靠前的內容推薦給用戶。
優點:適合剛剛註冊的用戶。比如,我今天剛申請微博,微博給我推送唐嫣和羅晉戀情。
缺點:不能提供個性化的推薦服務。
協同過濾算法(Collaborative Filtering, CF)
協同過濾算法通過對未評分項進行評分,預測來實現。CF分爲User-based CF和Item-based CF。
User-based CF原理Item-based CF原理
1.分析各個用戶對item的評價(歷史記錄)1.分析各個用戶對Item的瀏覽歷史
2.根據用戶對Item的評價計算得出所有用戶之間的相似度2.根據history分析出所有item的相似度
3.選出與當前用戶最相似的N個用戶3.對於當前用戶評價高的item,找出與之相似度最高的N個item
4.將N個用戶評價最高並且當前用戶沒有瀏覽過的item推薦給當前用戶4.將N個item推薦給當前用戶
優點: CF算法描述簡單,實現容易;推薦結果準;推薦個性化,自動化程度高;能處理複雜的非結構化對象。
缺點: 對於新用戶,推薦效果差;推薦數據取決於歷史數據集;存在矩陣稀疏問題。
基於內容的推薦算法(Content-based Recommendation)
CBR是建立在項目的內容信息上做出推薦,不需要依據用戶對項目的評價,更多的需要依據用機器學習的方法從關於內容的特徵描述中得到用戶感興趣的資料。比如我喜歡王小波的《青銅世代》,在噹噹網上買了王小波的《青銅時代》,那麼,基於內容的推薦算法會自動給我推薦王小波的《白銀時代》、《黃金時代》。
優點:沒有冷啓動問題和稀疏矩陣問題;能爲具有特殊興趣愛好的用戶進行推薦;技術相當成熟。
缺點:對於過度專業化的問題,採用CBR算法,系統會一直推薦給用戶內容密切相關的item,從而失去推薦內容的多樣性、豐富性。
基於模型的推薦算法(Model-based)
基於模型的推薦算法與基於Memory的推薦算法相對。當數據量特別大時,將用戶數據,讀入內存,進行運算,開銷較大,如果使用基於model的推薦算法,依託於機器學習的model,離線訓練,在線推薦,將會減少開銷。
常用的模型有:
貝葉斯分類,決策樹,神經網絡,專家系統,知識推理,矩陣分界,概率模型,圖模型,Boosting等
優點:推薦速度快速,準確度高,適用於實時性較高的業務,比如微博,澎湃新聞等。
缺點:屬性的組合和篩選取決於模型,如果數據集和模型之間存在較大的差異,推薦效率將大幅度下降。
組合推薦算法
在實際的應用場景,使用單一的推薦算法往往會導致推薦結果很差。所以,爲了提高推薦效率,常見的做法是,綜合多種推薦算法。比如,通過對不同的推薦算法計算出的結果進行加權處理,也可以在不同的計算環節運用不同的算法來混合結果。
評估推薦算法:
評價指標具體內容
推薦準確度通過計算預測item的預測評分與真實評價數據上的差別,來衡量推薦結果的準確性
覆蓋率儘量所有的商品,都可以找到各自適合的用戶
多樣性考察推薦算法給用戶推薦產品或者服務的多樣性
信任度在給出推薦商品或者服務的同時,給出推薦理由
健壯性推薦系統能夠自主識別惡意的點擊瀏覽行爲
停留時間對於音樂app,用戶的停留時間
點擊率和購買率類似淘寶這樣的電商平臺,更多關注推薦內容的點擊率,和推薦商品的購買率
改進推薦算法。
各大企業間加強戰略合作,分享用戶數據,解決推薦系統的冷啓動問題
豐富用戶的屬性,興趣愛好,人際關係等
對於社交平臺,根據用戶的人際關係,推測用戶的興趣愛好等內容。
推薦算法在雲計算平臺上進心,將解決推薦算法大數據運算問題
總結
推薦算法是極其有趣的領域。隨着技術的發展,計算機能夠準確的知道用戶想購買的商品、性格、愛好,推薦系統降低了我們尋找內容的成本。問題是,我們可能愈加依賴推薦系統。我認爲,尋找喜歡商品,音樂,朋友,是一件私人的事情,減少對計算機的依賴,培養自己的眼界、品味更加重要。