二分類中的混淆矩陣中有以下4種標記:
預測(列)/label(行) | 正樣本 | 負樣本 |
---|---|---|
正樣本 | TP(真正例) | FN(假反例) |
負樣本 | FP(假正例) | TN(真反例) |
TP(真正例) :將正樣本預測爲正樣本
FN(假反例):將正樣本預測爲負樣本
FP(假正例):將負樣本預測爲正樣本
TN(真反例):將負樣本預測爲負樣本
說明:後面的字母表示預測結果,前一個字母表示是否預測正確
precision:表徵分類器的分類效果(查準效果),它是在預測爲正樣本的實例中預測正確的頻率值,故,
recall:表徵某個類的召回(查全)效果,它是在標籤爲正樣本的實例中預測正確的頻率,故:
f1值:即用來衡量precision和recall的值,它是這個兩個值的調和均值,其中,
舉個例子
label | 0 | 0 | 1 | 0 | 1 | 1 | 0 | 1 | 0 | 1 |
---|---|---|---|---|---|---|---|---|---|---|
predict | 1 | 0 | 1 | 0 | 0 | 1 | 0 | 0 | 0 | 1 |
TP:真正例:即將正樣本預測爲正樣本, 3
TN:真反例:即將負樣本預測爲負樣本,4
FP:假正例:將負樣本預測爲了正樣本,1
FN:假反例:將正樣本預測爲了負樣本,2
所以P=3/(3+1)=0.75,R=3/(3+2)=0.6,f1=20.750.6/(0.75+0.6)=0.67