立即學習:https://edu.csdn.net/course/play/6861/326736?utm_source=blogtoedu
ROI 投資回報率
ROI >1 賺錢
SEMMA--數據分析流程
S:Sample(蒐集數據)
問卷調查
數據庫查詢
實驗室試驗
儀器設備的記錄
E:Explore(數據探索)如何預測收入範圍/影響收入的因素有哪些
離散變量的分佈比例(例如性別)
連續變量的分佈形態
數據的異常和缺失
特徵選擇
M:Modify(數據修正)常用的數據修正方法
數據類型的轉換
數據的一致性處理
異常值和缺失值的處理
數據形態的轉換
M:Model(數據建模)
側重於未知事件的預測
1.有監督的預測性模型(迴歸、決策樹、knn)
2.有監督的判別性模型
3.無監督模型
4.半監督模型
基於調查數據,預測用戶的收入水平
A:ASSESS (模型評估)
RMSE
混淆矩陣
ROC曲線
KS曲線
怎麼做好模型
1.增加樣本
2.擴展維度
3.修正模型參數
4.更換其他模型