推荐系统评估
准确度
打分系统
设rui 为用户u 对物品i 的实际评分,r^ui 为预测分,有如下误差判定标准:
RMSEMAE=∑u,i∈T(rui−r^ui)2|T|−−−−−−−−−−−−−−−√=∑u,i∈T|rui−r^ui||T|(371)
Top N推荐
设R(u) 为根据训练建立的模型在测试集上的推荐,T(u) 为测试集上用户的选择
PrecisionRecall=∑u∈U|R(u)∩T(u)|∑u∈U|R(u)|=∑u∈U|R(u)∩T(u)|∑u∈U|T(u)|(372)
覆盖率
表示对物品长尾的挖掘能力(针对平台商品而言)
CoverageH=|Uu∈UR(u)||I|=−∑i=1np(i)logp(i)(373)
多样性
推荐结果列表中物品的丰富性(两两之间的差异性,面向用户),s(i,j) 表示物品i 和j 之间的相似度,|R(u)| 表示集合元素数量(表示推荐给该u 用户的所用商品),多样性表示如下:
Diversity(R(u))Diversity=1−∑i,j∈R(u),i≠js(i,j)12|R(u)|(|R(u)|−1)=1|U|∑u∈UDiversity(R(u))(374)
新颖度:商品给用户的新鲜感(推荐不知道的商品)
惊喜度:推荐和用户历史兴趣不相似却满意的
信任度:提供可靠的推荐理由
实时性:实时更新程度
推荐系统类型
基于内容
基于用户喜欢的物品的属性\内容推荐,需要分析内容,不用考虑用户与用户之间的关联,通常使用在文本相关的推荐
协同过滤
根据用户在物品上的行为找到物品或者用户的“近邻”,物以类聚,人以群分
冷启动问题
隐语义模型