預測模型的類型:
1.分類模型:分類問題中有兩類算法
(1)類別輸出:比如SVM,KNN等
(2)概率輸出:LR,random forest,Gradient boosting,adaboost等都給出概率輸出。將概率輸出轉換爲類輸出僅僅只需要設定概率閾值
2.迴歸模型:輸出連續值
驗證矩陣:
1.混淆矩陣:僅用在類別輸出(修改概率閾值會引起矩陣變化)
N×N的矩陣,N代表類別數
2.增益和提升表
3.kolmogorov-smirnov chart
4.ROC曲線 AUC曲線下的面積
5.Gini指數:被用在分類問題=2*auc-1>=60%
6.一致-不一致比率
7.rmse:迴歸問題,對異常值比較敏感,在之前要處理過
8.k-fold:避免偶然情況,通用