推荐排序神经网络输入embedding的预训练----Item2Vec(ItemCF,UserCF)

2016年的论文:Item2vec: Neural Item Embedding for Collaborative Filtering

这篇文章比较朴素,创新性不高,基本是参照了google的word2vec方法,应用到推荐场景的i2i相似度计算中,但实际效果看还有有提升的。主要做法是把item视为word,用户的行为序列视为一个集合,item间的共现为正样本,并按照item的频率分布进行负样本采样,缺点是相似度的计算还只是利用到了item共现信息,1).忽略了user行为序列信息; 2).没有建模用户对不同item的喜欢程度高低。

Skipgram + Negative Sampling:

u_{i}是中心词,v_{j}是上下文词,v_{k}是负例样本。极大化似然函数,后面转成极小化负对数似然(和交叉熵损失函数一样)

最后表示embedding可以有3种方式:1. 用u_{i};2.用u_{i}+v_{i};3.用concatenate: [u_{i},v_{i}]

 

同理,UserCF可以把item被访问的用户序列视为一个集合,user间的共现为正样本;

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章