1. 什麼是ap?
在目標檢測領域,用來衡量檢測效果的指標。
詳細例子和計算過程見:https://www.jianshu.com/p/fbb96bb49782,下面概述
a)對於每個預測的box, 按照score 排序 b)計算true positive, false positive, false negtive, 因爲是對一個box算,所以非零即一,按照score排序,計算累計precision和recall, 在precision/recall座標中畫出累計計算的每個點,c)計算曲線下方的面積,從而得到ap值。
對於mot17中person detection, 因爲目前網絡都比較厲害,所以前面的score 比較高的非常多的box, 都是對的即,precison=1, recall=1,從而累計多個box,pr曲線都十分上方。到了很後面的一些box,纔會出現很多precison=0, recall=0,所以precision會往下掉
如下面兩張圖,來自 https://motchallenge.net/results/MOT17Det/?chl=9&orderBy=AP&orderStyle=ASC, 第一張圖,precision都降低到0.4以下了,說明有超過60%的box檢測錯誤了。即這張圖,曲線的最後一個點纔是整個檢測結果的精度。所以雖然第一張圖,雖然ap最好,即曲線下方面積最大,可是有超過60%的box檢測錯誤,最後一張圖,雖然ap,曲線下方面積略低,但是最有一個點,說明約90%的box檢測正確,只有約10%的box檢測錯誤。
2. resnet構建fpn,res2的相對於原圖尺寸,變化有多大?
resnet50可視化見https://ethereon.github.io/netscope/#/gist/df717cef7858bc69f8477c8db55a1cb7,
res2最後的輸出res2c相對與原圖,縮放了1/4