推荐排序神经网络输入embedding的预训练----Item2Vec(ItemCF,UserCF)

原創

2019-12-04 02:13

2016年的论文：Item2vec: Neural Item Embedding for Collaborative Filtering

这篇文章比较朴素，创新性不高，基本是参照了google的word2vec方法，应用到推荐场景的i2i相似度计算中，但实际效果看还有有提升的。主要做法是把item视为word，用户的行为序列视为一个集合，item间的共现为正样本，并按照item的频率分布进行负样本采样，缺点是相似度的计算还只是利用到了item共现信息，1).忽略了user行为序列信息; 2).没有建模用户对不同item的喜欢程度高低。

Skipgram + Negative Sampling:

$u_{i}$ 是中心词， $v_{j}$ 是上下文词， $v_{k}$ 是负例样本。极大化似然函数，后面转成极小化负对数似然（和交叉熵损失函数一样）

最后表示embedding可以有3种方式：1. 用 $u_{i}$ ；2.用 $u_{i}+v_{i}$ ；3.用concatenate: $[u_{i},v_{i}]$

同理，UserCF可以把item被访问的用户序列视为一个集合，user间的共现为正样本；

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【推荐系统】Graph Embedding系列之node2vec: Scalable Feature Learning for Networks

摘要什麼是embedding? Embedding在數學上表示的是一個映射關係，F: X -> Y，也就是一個函數。該函數具有兩個性質：injective和structure-preserving。Injective，即我們所說的單射函

长相忆兮长相忆

2020-07-08 12:03:46

【推荐系统】Graph Embedding系列之LINE

摘要什麼是embedding? Embedding在數學上表示的是一個映射關係，F: X -> Y，也就是一個函數。該函數具有兩個性質：injective和structure-preserving。Injective，即我們所說的單射函

长相忆兮长相忆

2020-07-07 05:01:39

【推荐系统】Graph Embedding系列之DeepWalk

摘要什麼是embedding? Embedding在數學上表示的是一個映射關係，F: X -> Y，也就是一個函數。該函數具有兩個性質：injective和structure-preserving。Injective，即我們所說的單射函

长相忆兮长相忆

2020-07-07 05:01:39

推荐系统系列（二）：从零开始搭建基于向量的推荐策略

從零開始搭建基於向量的推薦策略背景架構離線Pipeline搭建用戶行爲日誌上報日誌存儲到數據倉庫數據預處理模型訓練構建項目索引在線服務用戶向量預測最近項目查找總結參考背景向量召回/語義向量召回是現在流行的一種推薦策略，簡單來說

2020-07-08 12:17:27

精读 An LSTM-Based Dynamic Customer Model for Fashion Recommendation 总结

精讀 An LSTM-Based Dynamic Customer Model for Fashion Recommendation 總結研究成果1. 前言2. 研究內容2.1 數據描述2.2 Fashion DNA的生成（商品表

2020-07-08 10:45:04

独孤九剑：算法模型训练的一般流程

這篇文章主要分享一下模型訓練的一般流程，目的是讓大家明白做一個算法模型過程中會涉及的流程和數據特徵在算法模型中的重要性。作爲一名算法工程師訓練模型可謂是家常便飯，不管是做推薦中的召回模型、排序模型還是其他領域的分類模型等，都應該

2020-07-08 09:19:54

读书笔记：推荐系统与深度学习-第五章-混合推荐系统

1 什麼是混合推薦系統目前介紹的算法各有利弊：基於內容的推薦方法：一類item的特徵描述協同過濾：利用user和item的特定類型的信息轉化生成推薦結果社交網絡的推薦算法：根據user的相互影響關係進行推薦所以，希望構

2020-07-08 05:02:59

混合推荐总结

混合推薦系統是推薦系統的另一個研究熱點，它是指將多種推薦技術進行混合相互彌補缺點，從而可以獲得更好的推薦效果。最常見的是將協同過濾技術和其他技術相結合，克服cold start的問題。（1）加權型就是將多種推薦技術的計算結果加權混

2020-07-07 19:13:06

2018_WWW_DKN- Deep Knowledge-Aware Network for News Recommendation阅读笔记

Xmind思維導圖： deep knowledge-aware network(DKN) properties： incorporates knowledge graph representation into news r

2020-07-07 06:54:41

基于用户的协同过滤算法(UserCF)

用戶相似度計算協同過濾算法主要利用行爲的相似度計算興趣的相似度。給定用戶和用戶，令表示用戶感興趣的物品集合，令爲用戶感興趣的物品集合。那麼我們可以通過公式或者餘弦公式來計算用戶 , 的相似程度：假設目前共有

2020-07-07 02:47:53

基于物品的协同过滤算法(ItemCF)

物品相似度計算餘弦相似度公式：其中，分別表示對物品，喜歡的用戶數，爲同時喜歡和的人數。我們這裏還是使用漫威英雄舉例：假設目前共有5個用戶： A、B、C、D、E；共有5個漫威英雄人物：死侍、鋼鐵俠、美國隊長、黑豹、蜘蛛俠。用戶與

2020-07-07 02:47:43

【Paper Note】Representation Learning-Assisted Click-Through Rate Prediction (DeepMCP) 论文详解

https://arxiv.org/pdf/1906.04365.pdf 背景以往的點擊率預估模型像FM系列、WDN等模型，都只是考慮特徵和ctr之間的聯繫，阿里的這篇論文，提出了DeepMCP模型，不僅考慮了特徵和ctr之間

2020-07-07 01:30:56

PageRank总结&python实现

本文將記錄在學習pagerank的有關內容，如果您也在做相關的工作請與我郵件溝通交流 [email protected] 文章目錄pagerank理論及推導計算PageRank涉及到的數學內容馬爾科夫過程p

2020-07-07 01:24:52

毕业设计-mahout实现基于用户的协同过滤算法和基于物品的协同过滤算法之java实现（mysql）

簡介： Mahout 是 Apache Software Foundation（ASF）旗下的一個開源項目，提供一些可擴展的機器學習領域經典算法的實現，旨在幫助開發人員更加方便快捷地創建智能應用程序。Mahout包含許多實現，包括聚類、

2020-07-06 22:44:19

冷启动问题——协同过滤（推荐系统）

冷啓動問題——協同過濾（推薦系統）1. 什麼是冷啓動問題2. 協同過濾2.1 User CF2.2 Item CF 1. 什麼是冷啓動問題冷啓動問題：推薦系統需要根據用戶的歷史行爲和興趣預測用戶未來的行爲和興趣。這類問題主要

2020-07-06 22:14:00

24小時熱門文章

最新文章

最新評論文章