MAP學習記錄

主要參考https://github.com/rafaelpadilla/Object-Detection-Metrics

名詞解釋

預測結果分爲4個類:

TP:你的預測正確的預測了目標

FP:你的預測錯誤的預測了目標

FN:有一個目標你沒檢測到

TN:你正確的對非目標,也即是背景做出預測,一般這一項忽略

名詞解釋:

precision描述了你的所有的預測的正確率是多少。比如說你做出了100個預測,97個是正確的,那麼就是0.97.

recall描述了檢測率,即是圖片中一共有多少目標,你檢測到了多少。比如圖片一共10個目標,你檢測到7個,那麼recal就是0.7。

AP的意識就是,固定一個iou閾值,變化confidence閾值,得到曲線,然後計算曲線與recall軸的面積。其意義其實就是算個平均值,不同confidengce閾值下precision的平均值。

爲什麼平均值是面積?比如你粗略計算一個曲線在某一區間的均值,就是隨便取幾個點,相加然後平均,而將隨便取的幾個點的數量趨於無窮,那麼此時的求平均公式可以轉換成定積分公式,而定積分就是求面積,因此就是面積。

AP0.5是指將iou的threshold定爲0.5時的AP。

 

各個參數的關係

無論哪個目標檢測模型,都會輸出boxes和boxes是否是目標的預測值,這個在參考文獻中叫confidence。而一般來說,一副圖片的輸出結果會有成千上萬個box,一般來說這些box的confidence都很小,因爲圖片中的背景佔的比例多。

而在處理box時,會給定一個閾值,如0.4,所有confidence小於0.4的都認爲是背景。且一般來說confidence越大,盒子的數量就越少,反之盒子的數量多recall大、而precision小。因此是confidence變,而判斷預測對不對還要用到iou,比如預測的框和目標的框大於0.5就算預測正確,一般畫那個曲線,iou是不變的,變的是confidence。

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章