推薦算法概述（基於用戶的協同過濾算法、基於物品的協同過濾算法、基於內容的推薦算法）

原創

2019-02-14 22:50

目前推薦系統研宄的主要趨勢是從單一的、獨立的推薦系統算法逐漸向組合多種推薦算法形成混合式的綜合推薦算法方向發展，越來越多的結合用戶標籤數據、社交網絡數據、上下文信息、地理位置信息。羣體推薦也成爲一個目前非常熱門的主題。並且有些也用到了推薦系統領域之外的算法，如模糊集概念、人工智能領域的遺傳算法，貝葉斯網絡等。當然也有一些研究還在不斷深入挖掘傳統、經典的如基於內容過濾、協同過濾等算法可能的改進算法。

互聯網上的很多數據分佈都屬於長尾分佈，即大部分數據的使用頻率很低，只有少部分的數據被廣泛使用，這小部分數據其實就是熱門數據，但如果把熱門數據和冷門數據的使用量作對比，會發現冷門數據的使用量遠遠大於熱門數據的使用量，這也許和人們想象中相反，但這是經過長時間的統計分析得出的結論。用戶的行爲數據其實也符合這一規律，無論從物品角度的物品流行度，還是用戶角度的用戶流行度都符合長尾分佈。

推薦系統算法概述

推薦系統的研究大致可以分爲三個階段，第一階段是基於傳統的服務，第二階段是基於目前的社交網絡的服務，第三階段是即將到來的物聯網。這其中產生了很多基礎和重要的算法，例如協同過濾（包括基於用戶的和基於物品的）、基於內容的推薦算法、混合式的推薦算法、基於統計理論的推薦算法、基於社交網絡信息（關注、被關注、信任、知名度、信譽度等）的過濾推薦算法、羣體推薦算法、基於位置的推薦算法。其中基於鄰域的協同過濾推薦算法是推薦系統中最基礎、最核心、最重要的算法，該算法不僅在學術界得到較爲深入的研究，而且在業界也得到非常廣泛的應用，基於鄰域的算法主要分爲兩大類，一類是基於用戶的協同過濾算法，另一類是基於物品的協同過濾算法，除此之外，基於物品的推薦算法應用也非常廣泛，所以下文將對這三種基礎算法進行詳細介紹。

基於用戶的協同過濾算法

基於用戶的協同過濾算法簡稱，其簡單應用情景是：當用戶需要個性化推薦時，可以先找到與他相似其他用戶（通過興趣、愛好或行爲習慣等，然後把那些用戶喜歡的並且自己不知道的物品推薦給用戶。

注：兩個用戶對流行物品的有相似興趣，絲毫不能說明他們有相似的興趣，此時要增加懲罰力度。

基於物品的協同過濾算法

基於物品的協同過濾算法簡稱，其簡單應用情景是：當一個用戶需要個性化推薦時，例如由於他之前購買過金庸的《射鵰英雄傳》這本書，所以會給他推薦《神鵰俠侶》，因爲其他用戶很多都同時購買了這兩本書。

注：1、如果是熱門物品，很多人都喜歡，就會接近1，就會造成很多物品都和熱門物品相似，此時要增加懲罰力度。

2、活躍用戶對物品相似度的貢獻小於不活躍的用戶。

基於內容的推薦算法
雖然協同過濾是目前較爲流行的推薦算法，在學術界和工業界都有廣泛的研究和使用，但同樣作爲推薦系統領域的基礎算法一一基於內容的推薦也是很重要的，其他它還是最早出現的推薦算法。其基本原理是根據用戶之前對物品的歷史行爲（如用戶購買過什麼物品、對什麼物品收藏過、評分過等等，然後再根據計算與這些物品相似的物品，並把它們推薦給用戶。例如用戶之前購買過金庸的武俠小說，這可以說明用戶可能是一個金庸迷或武俠迷，這時就可以給用戶推薦一些金庸的其他武俠小說。基於內容的推薦算法之前也成爲基於內容的過濾（搜索）算法，早期主要應用在信息檢索和信息過

基於內容的推薦算法一般包括以下三步：

1、爲每個物品抽取一些特徵用來表示這個物品。

2、使用用戶的歷史行爲數據分析物品的這些特徵，從而學習出用戶的喜好特徵或者說興趣。

3、通過比較上一步得到的用戶興趣和待推薦物品的特徵，確定一組相關性最大的物品作爲推薦列表。

推薦系統基礎算法對比

UserCF是給用戶推薦那些和他有共同興趣的用戶喜歡的物品，ItemCF則是爲用戶推薦那些和他之前喜歡的物品類似的物品，所以UserCF推薦較爲社會化，即推薦的物品是與用戶興趣一致的那個羣體中的熱門物品，ItemCF的推薦較爲個性，因爲推薦的物品一般都滿足自己的獨特興趣。

轉載自：https://blog.csdn.net/u011630575/article/details/80171597

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

推薦算法概述（基於用戶的協同過濾算法、基於物品的協同過濾算法、基於內容的推薦算法）

美團一面：項目中有 10000 個 if else 如何優化？想了半天，被問懵了！

京東面試：如何進行JVM調優？

Python 將PowerPoint (PPT/PPTX) 轉爲HTML

SQL優化-20231016

【Django】Python的Django框架-數據庫查詢(增刪改查)

滑動驗證碼識別----解決天眼查自動登錄問題

【Kafka】python創建kafka的生產者和消費者

機器學習數學精華：高等數學/線性代數/概率論與數理統計

如何實踐一個完整的數據挖掘項目

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結