学习笔记(02):零基础搞定Python数据分析与挖掘-数据分析的流程

立即学习:https://edu.csdn.net/course/play/6861/326736?utm_source=blogtoedu

ROI 投资回报率

ROI >1  赚钱

 

SEMMA--数据分析流程

 

S:Sample(搜集数据)

    问卷调查

    数据库查询

    实验室试验

    仪器设备的记录

 

E:Explore(数据探索)如何预测收入范围/影响收入的因素有哪些

    离散变量的分布比例(例如性别)

    连续变量的分布形态

    数据的异常和缺失

    特征选择

 

M:Modify(数据修正)常用的数据修正方法

    数据类型的转换

   数据的一致性处理

    异常值和缺失值的处理

   数据形态的转换

 

M:Model(数据建模)

侧重于未知事件的预测

 1.有监督的预测性模型(回归、决策树、knn)

2.有监督的判别性模型

3.无监督模型

4.半监督模型

基于调查数据,预测用户的收入水平

 

A:ASSESS (模型评估)

RMSE

混淆矩阵

ROC曲线

KS曲线

 

怎么做好模型

1.增加样本

2.扩展维度

3.修正模型参数

4.更换其他模型

   

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章