人工智能教程 - 专业选修课程4.3.11 - 复杂结构数据挖掘 8.推荐系统,大数据注意事项

推荐系统

效用矩阵

utility matrix

X =客户组 Customers
S =项目集 Items
实用功能 Utility function u：X×S $\rightarrow$ R

R =一组评分的集合
R是一个完全有序的集合
例如1-5星，实数为[0,1]

效用矩阵步骤

（1）收集矩阵的“已知”等级
Gathering “known” ratings for matrix

如何收集效用矩阵中的数据
（2）从已知的向外推出未知的评分
我们对您不满意的内容不感兴趣但是感兴趣你喜欢什么
（3）评估外推方法
如何衡量推荐方法的成功/绩效

用户模型

我们不仅仅要为项建立向量表示，也需要将用户的偏好表示成同一空间下的向量。我们拥有将项和用户关联起来的效用矩阵，效用矩阵中的每个非空元素可以代表用户购买过该项或类似关系，也可以是表示用户对项的评分或喜好程度的一个任意数字。
在上述信息下，要知道用户到底喜欢哪些项，最好的估计方法就是对这些项的模型进行某种累计。如果效用矩阵仅仅包含1，那么最自然的累计方法就是用户在效用矩阵中元素为1的所有项的表示向量求平均值。

决策树

决策树是一颗组织成二叉树的节点集合。其中叶子节点代表决策，在我们的例子，决策可能是“喜欢”或者“不喜欢”。每个内部节点代表分类对象要满足一个条件，这里的条件可能是涉及一个或者多个项特征的谓词表达式。

基于内容的推荐系统

优势：

+：不需要协同其他用户的数据
- 不用解决冷启动或稀疏问题
+：可以向具有以下要求的用户推荐
- 个性化的风格
+：可以推荐新的和不受欢迎的商品
- 不只是排名前的
+：能够提供可解释性

存在的问题

–：有一些很难找到合适特性的内容 Finding the appropriate features is hard
- 例如图像，电影，音乐
–：没有对新用户的建议 Recommendations for new users
- 如何建立用户档案？
–：过度专业化 Overspecialization
- 绝不推荐用户以外的商品内容
- 人们可能有多种兴趣
- 无法利用其他用户的质量判断

协同过滤

找相似用户

相似性指标

评分预测

大数据注意事项

利用所有数据Leverage all the data
- 请勿尝试为了使花式算法起作用，而减少数据量。
- 处理大数据的方法：简单最有效
添加更多数据
- 例如，在流派上添加IMDB数据

人工智能教程 - 专业选修课程4.3.11 - 复杂结构数据挖掘 8.推荐系统,大数据注意事项

推荐系统

分类

基于内容的系统(Content-Based System) 目前的主流

协同过滤系统(Collaborative Filtering System) 目前的主流

基於潜在因子技术 Latent factor based

其他技术。这些技术本身并不足够，有一些新的算法被证明在推荐系统中十分有效。

效用矩阵

效用矩阵步骤

用户模型

决策树

基于内容的推荐系统

优势：

存在的问题

协同过滤

找相似用户

相似性指标

评分预测

大数据注意事项

利用所有数据Leverage all the data

请勿尝试为了使花式算法起作用，而减少数据量。

处理大数据的方法：简单最有效

添加更多数据

例如，在流派上添加IMDB数据

更多数据胜过更好的算法

如何使用 JS 判断用户是否处于活跃状态

通过HPA+CronHPA组合应对业务复杂弹性伸缩场景

❤️‍🔥 Solon Cloud Event 新的事务特性与应用

人工智能教程 - 學科基礎課程2.6 - 機器學習導論 14.降維,數據壓縮,可視化數據,PCA簡介

人工智能教程 - 專業選修課程4.3.11 - 複雜結構數據挖掘 7.在線算法,貪心算法,完美匹配

人工智能筆記之專業選修課4.1.5 - 博弈論 1.退避機制，博弈基本概念，重要元素，形式

人工智能教程 - 專業選修課程4.3.5 - 強化學習 12.無模型預測,蒙特卡羅強化學習

人工智能筆記之專業選修課4.1.5 - 博弈論 2.經典囚徒困境等經典博弈場景

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結