1 、損失函數種類
- 0-1損失函數
J(θ)=1Y≠f(x) J(θ)=0Y=f(x) - 感知損失函數
J(θ)=1|Y−f(X)|>t J(θ)=0|Y−f(X)|<t - 平方和損失函數
J(θ)=∑i=1m(hθ(x(i)−y(i))2 - 絕對值損失函數
J(θ)=∑i=1m|hθ(x(i)−y(i)| - 對數指標
J(θ)=∑i=1m(y(i)loghθ(x(i)))
2 、性能指標
2.1 錯誤率與精度:
m個樣本,有a個分錯。
錯誤率:
精度:
2.2 查準率、查全率和F1:
TP:真正例 / TN:真反例
FP:假正例 / FN:假反例
查準率:
查全率:
F1是查準率和查全率的調和平均數:
與算術平均數相比,調和平均數更加重視較小值。如果對查全率和查準率有偏好,引出了加權調和平均數:
其中
2.3 ROC和AUC:
將m+個正例和m-個負例放進模型,然後預測值從小到大排列,模型目標是讓正例儘可能小,負例儘可能大,從最小樣例開始,如果是正例,就向上移一格,也就是
ROC曲線下的面積就是AUC值,AUC越接近1證明模型效果越好。
2.4 迴歸模型評價指標
MSE:均方差
MAE:平均絕對值誤差
RMSE:
TSS:總平方和,表示樣本之間的差異情況。
RSS:殘差平方和,表示預測值和樣本值之間的差異情況
3 、評估方法
3.1 留出法
劃分出互斥的訓練集和測試集,注意兩個集合的分佈儘量保持一致,通常採用分層採樣的方法。通過若干次的隨機劃分得到比較穩定可靠的結果。
3.2 交叉驗證法
p次k折的交叉驗證法,就是k-1個子集作爲訓練集,剩下的1個作爲測試集。
3.3 自助法
有放回的採用,產生更多的測試機,bootstrapping,同時有一部分的數據不會被採集到,可以作爲外包估計。