學習筆記(02):零基礎搞定Python數據分析與挖掘-數據分析的流程

立即學習:https://edu.csdn.net/course/play/6861/326736?utm_source=blogtoedu

ROI 投資回報率

ROI >1  賺錢

 

SEMMA--數據分析流程

 

S:Sample(蒐集數據)

    問卷調查

    數據庫查詢

    實驗室試驗

    儀器設備的記錄

 

E:Explore(數據探索)如何預測收入範圍/影響收入的因素有哪些

    離散變量的分佈比例(例如性別)

    連續變量的分佈形態

    數據的異常和缺失

    特徵選擇

 

M:Modify(數據修正)常用的數據修正方法

    數據類型的轉換

   數據的一致性處理

    異常值和缺失值的處理

   數據形態的轉換

 

M:Model(數據建模)

側重於未知事件的預測

 1.有監督的預測性模型(迴歸、決策樹、knn)

2.有監督的判別性模型

3.無監督模型

4.半監督模型

基於調查數據,預測用戶的收入水平

 

A:ASSESS (模型評估)

RMSE

混淆矩陣

ROC曲線

KS曲線

 

怎麼做好模型

1.增加樣本

2.擴展維度

3.修正模型參數

4.更換其他模型

   

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章