評估曲線

曲線: P-R
X軸是Percision, Y軸是Reall。
Percision=TP/FP+TP,也就是預測是陽性並且正確的/預測是陽性的。這個值大意味着這個模型預測出來的陽性很多都是對的,當置信度大時,一般精確度也大。
Recall=TP/TP+FN, 也就是預測是陽性並且正確/所有的陽性。Recall越高,表示漏掉的陽性越少如果把所有的數據集都預測爲陽性,那麼Recall就是1,非常高,但是精確度就低了,預測錯很多。
比較理想的狀態是Recall很高,Percision也很高,當所有的正樣本都被挑出來了,並沒有一個隱性的被挑出來當成陽性,這時Recall和Percision都是1.

曲線: Lift
Lift值=Percision/Baseline
可以用隨機的方法選取正樣本的概率作爲Baseline,也就是正樣本的個數/樣本總數。
Lift值越大說明使用這個模型比隨機選好的越多。Lift曲線的X軸是Depth, 它是預測爲正例的比例,這個值越大,相當於閾值越小,閾值越小Percision越低,
所以在最右側Depth很大,Lift的值很小,在左側相反。

曲線:KS
曲線的X軸是閾值,y軸是0到1,可以分別繪值fpr和tpr的曲線,KS曲線實際上是fpr+tpr,這其中tpr-fpr的最大值值就是KS值,值越高說明模型分辨正負樣本的能力越強。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章