Effective DeepLearning-圖像識別中的P-R曲線是如何產生的

在做圖像分類和標註的模型的時候,發現大家對其中一個評價指標P-R曲線圖的生成比較疑惑,這裏就想跟大家探討一下我自己的理解。

做過圖像分類和圖像標註的小夥伴都會曉得下面兩個圖

一,這個是描述一個分類的P準確率(簡單理解就是模型出這個結果會有多少的概率是可以相信這個結果的)和R召回率(就是你放一個這個分類進去模型做預測它出來的結果有多少概率是可以相信的)的計算方式,還有就是F1-scroe的計算方式(也有小夥伴說這只是二分類的計算方式,但是即使你的模型有幾千分類,其中一個分類的這些指標,相對於其他分類之間他們也是形成了一個類似二分類的情況)

二,然後很多的書籍或者文章就立刻會介紹,在模型訓練完成後從上面的P和R就可以得到下面的P-R曲線圖。這使得很多剛剛接觸的小夥伴(當然包括我/(ㄒoㄒ)/~~)很是疑惑爲什麼上面只是一個值,在圖片裏面頂多是一個點,怎麼能得到下面的曲線呢(這個圖只是拿來做例子,具體的數據不一定準確。例如當R爲0,P應該也爲0因爲圖一中的A已經爲0了,現在大量的文章都是這樣導致新手們看得痛苦,然後就死在起跑線上了)

就拿上面這個曲線圖爲例子(雖然不太準確)。x軸R召回率有0,0.2,0.4......1.0。這裏就是圖一說的A/A+C,A就是識別正確的,C就是不能識別的(這就是爲啥說R爲0,P應該也爲0,因爲A都是0了,還能是想圖二那樣P到0.9麼)。到了這裏A應該就容易得到了,既然是的監督學習識別正確的就沒有什麼非議的了,問題是C是怎麼得到的。一般來說用模型得到預測結果還會有一個輸出就是該結果的置信度。如果用置信度來做標準,那麼這樣數據就容易出來了。例如是置信度大於0.9的纔算到A裏面,其他的都是C裏面,那麼就可以得到一個R了。如此類推,置信度是0.8,0.7.....0得到的R也就同時得到了P的值。那麼圖二的曲線就出來了。

這裏說得比較籠統也沒有搬出具體的數據表,以後有時間會加上。希望大家多討論不要死在起跑線上了。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章