立即学习:https://edu.csdn.net/course/play/6861/326736?utm_source=blogtoedu
ROI 投资回报率
ROI >1 赚钱
SEMMA--数据分析流程
S:Sample(搜集数据)
问卷调查
数据库查询
实验室试验
仪器设备的记录
E:Explore(数据探索)如何预测收入范围/影响收入的因素有哪些
离散变量的分布比例(例如性别)
连续变量的分布形态
数据的异常和缺失
特征选择
M:Modify(数据修正)常用的数据修正方法
数据类型的转换
数据的一致性处理
异常值和缺失值的处理
数据形态的转换
M:Model(数据建模)
侧重于未知事件的预测
1.有监督的预测性模型(回归、决策树、knn)
2.有监督的判别性模型
3.无监督模型
4.半监督模型
基于调查数据,预测用户的收入水平
A:ASSESS (模型评估)
RMSE
混淆矩阵
ROC曲线
KS曲线
怎么做好模型
1.增加样本
2.扩展维度
3.修正模型参数
4.更换其他模型