推薦系統簡述

原創

攻城猿bilibili

2020-02-22 11:01

推薦系統分爲基於用戶和基於物品

舉個例子，用戶A喜歡給《上海堡壘》打高分，用戶B也喜歡給《上海堡壘》高分，我們可以看出A，B臭味相投，A喜歡的電影也可以推薦給B，這就是基於用戶的推薦系統。如果A喜歡電影《上海堡壘》，而《上海堡壘》和《富春山居圖》很類似，由此推斷，用戶A也可能喜歡《富春山居圖》這是基於物品的推薦系統。

基於用戶的協同過濾算法

這裏只介紹餘弦相似性算法：

下面給出一個例子：

上面分別是A與B和C的餘弦相似性，例如：上面的4*5是A，B都看過魔法石，分母是A，B的模。
A，B 的相似度低於A，C。根據我們的判斷，A，B的相似度是要大於A，C的。我們仔細看錶格，A喜歡的基本上C都不喜歡，而A喜歡的和B喜歡的評分差不多。綜上，這種算法是不合理的。

下面我們需要改進這種算法，引入了Pearson相似性算法

Pearson相似性算法

求的平均值，第一行10 表示 4+5+1，3表示看了3部電影（魔法石，火焰杯，鳳凰社）

每一行評分減去平均值得到上面那個表格，再對錶格來進行上面的餘弦相似度算法計算。

基於物品的協同過濾算法

用戶A喜歡物品A和C，用戶C也喜歡物品A和C。所以我們推測物品A和C有很大的相似度。所以當用戶B也喜歡物品A時,而用戶B不瞭解物品C時，我們自動的將物品C推薦給用戶B。

下面給出一個例子：

我們用pearson算法計算下面五部電影和哈利波特的相似度，得到右邊那個表格，哈利波特和自身是1。

用下面的公式來計算評分：

這裏之所以選擇阿甘和星際是因爲這兩部電影相似度和哈利波特是最高的。

攻城猿bilibili

發佈了140 篇原創文章 · 獲贊 42 · 訪問量 9萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

京東廣告研發 —— 京東推薦廣告排序機制演化

1、序言：廣告排序機制的前世今生 1.1、簡介：廣告排序機制在線廣告是國內外各大互聯網公司的重要收入來源之一，而在線廣告與傳統廣告最大的區別就在於其超大規模的實時競價環境：數以萬計的廣告主在一天內可以參與億級別的流量競拍。在這複雜的實

2024-04-24 23:17:14

Pinecone: 大模型時代的智能索引與搜索解決方案

隨着人工智能技術的飛速發展，大模型（Large Models）已成爲衆多領域的重要工具。無論是自然語言處理、圖像識別還是其他複雜任務，大模型都展現出了強大的性能。然而，隨着模型規模的不斷擴大，數據量的激增，如何有效地管理、索引和搜索這些模型

2024-04-19 11:29:43

深度解析大模型推理框架：原理、應用與實踐

在當今數據驅動的時代，大模型推理框架已經成爲人工智能領域的重要支柱。本文將通過簡明扼要、清晰易懂的方式，帶領讀者深入瞭解大模型推理框架的原理、應用領域和實踐經驗，幫助讀者更好地掌握這一技術，並在實際工作中發揮其價值。一、大模型推理框架簡介

2024-04-11 23:28:49

華爲雲GeminiDB，廣告RTA的“登雲梯”

本文分享自華爲雲社區《華爲雲GeminiDB，廣告RTA的“登雲梯”》，作者： GeminiDB-Redis博客。行話說，廣告RTA要想效果好，數據庫挑戰少不了。那麼，廣告RTA對數據庫究竟有哪些挑戰？在上篇文章《究竟什麼樣的數據庫，才能

2024-04-09 10:32:19

大模型推理框架：從理論到實踐的全面解析

在數據驅動的時代，深度學習技術已經滲透到各個行業，從圖像識別到自然語言處理，從推薦系統到智能客服，其應用無處不在。然而，深度學習模型的訓練和推理過程往往涉及大量數據和複雜計算，傳統的計算框架難以滿足需求。因此，大模型推理框架應運而生，成爲解

2024-03-23 00:31:01

正式支持騰訊雲！Zilliz Cloud 多雲版圖再度擴張

3 月 22 日，Zilliz 對外透露，Zilliz Cloud 的用戶可以利用騰訊雲在北京和上海區的雲服務搭建雲應用，這將進一步爲海內外用戶提供更爲豐富的多雲支持的向量數據庫雲服務！這是繼阿里雲後，Zilliz Cloud 在國內新

2024-03-22 14:51:11

解鎖深度表格學習（Deep Tabular Learning）的關鍵：算術特徵交互

近日，阿里雲人工智能平臺PAI與浙江大學吳健、應豪超老師團隊合作論文《Arithmetic Feature Interaction is Necessary for Deep Tabular Learning》正式在國際人工智能頂會AAAI

2024-03-21 01:31:46

京東廣告算法架構體系建設--高性能計算方案最佳實踐

1、前言推薦領域算法模型的在線推理是一個對高併發、高實時有較強要求的場景。算法最初是基於Wide & Deep相對簡單的網絡結構進行建模，容易滿足高實時、高併發的推理性能要求。但隨着廣告模型效果優化進入深水區，基於Transformer

2024-03-15 13:45:05

多模態+大模型會帶來哪些“化學反應”？

導語：沒人懷疑，2024 年，AI 依然將是科技界的主角。上個月，OpenAI 推出了可以生成 60 秒高清視頻的視頻生成模型 Sora，掀起了對多模態模型的進一輪討論。多模態大模型技術的最新進展如何？這一波新技術，對於行業和消費者的體驗會

2024-03-15 13:45:01

大模型技術調研與端應用形態探索

在人工智能領域，大模型（Large Model）技術的崛起標誌着深度學習進入了一個全新的階段。這些模型通常包含數十億甚至千億級別的參數，通過大規模的數據訓練，能夠在語音識別、自然語言處理、圖像識別等多個領域取得令人矚目的成就。那麼，大模型究

2024-03-08 12:36:05

Z Potentials | 星爵，他的征途不止向量數據庫

縱觀過去幾十年的科技發展史，每一代新的技術架構的出現往往都伴隨着新的數據範式的出現，也催生了多家百億到千億美金數據平臺的誕生。如果說 2023 年科技領域的關鍵詞是 LLM，那麼數據庫領域的關鍵詞一定非向量數據庫莫屬。向量數據庫是一種專門用

2024-03-07 21:26:17

揭祕 LLMs 時代向量數據庫的 3 大實用場景

過去一年，ChatGPT 和其他大語言模型（LLMs）的爆火也帶動了向量數據庫的發展。許多用戶在搭建檢索增強生成（RAG）系統過程中選擇了使用向量數據庫 Zilliz Cloud ，但 Zilliz Cloud 的功能不止於此

2024-02-23 14:52:22

覆盤了今年春節，主打一個AI應用讓我「機智過人」

鞭炮聲聲辭舊歲，春光融融迎新年。春節，這一喜慶團圓的節日意味着萬象更始，一幅嶄新的畫卷已經徐徐展開——在數字化、智能化的時代背景下，科技爲這一歷史悠久的節日注入了新的活力與魅力。春節與科技的強強聯合，不僅展現了中華民族的智慧與創新精神，也讓

2024-02-23 12:37:09

零門檻AI開發平臺EasyDL：百億參數大模型ERNIE的加持

隨着人工智能技術的不斷髮展，越來越多的企業和個人開始關注如何快速開發出高效的AI模型。在這個背景下，EasyDL應運而生，作爲一個零門檻AI開發平臺，它降低了AI開發的門檻，讓更多人能夠輕鬆地開發和部署AI模型。而當EasyDL與百億參數大

2024-02-21 12:33:38

推薦系統系列（二）：從零開始搭建基於向量的推薦策略

從零開始搭建基於向量的推薦策略背景架構離線Pipeline搭建用戶行爲日誌上報日誌存儲到數據倉庫數據預處理模型訓練構建項目索引在線服務用戶向量預測最近項目查找總結參考背景向量召回/語義向量召回是現在流行的一種推薦策略，簡單來說

2020-07-08 12:17:27

24小時熱門文章

最新文章

最新評論文章