IOU:
Precison
我們要找的目標爲狗,結果查找的目標中有貓。我們希望通過一個指標去描述這個問題,所以提出precision,描述查找一個目標的精準率。
Recall
明明右上角是一隻狗,結果沒有找出來,爲了表述這個問題,提出recall,描述查找一個目標的漏檢率。
我們將被正確識別的狗,稱爲True positives(TP)。我們將被正確識別的貓稱爲True negatives(TN)。(意思應該是沒有被框出來的,確實是貓的爲TN)目標是找狗,那麼那些沒有標註的貓,從反向說明了查找準確率(precision)。接着,定義被錯誤識別爲狗的貓爲False positives(FP)。被錯誤識別爲貓的狗稱爲False negatives(FN)(就是右上角的狗,受IOU指標影響)。
Precision=TP/(TP+FP) (所以這是按個數的?)
Recall=TP/(TP+FN)
Accuracy=(TP+TN)/(TP+FN+TN+FT)
非極大值抑制(Non-Maximum Suppression,NMS)
(1) 絕大部分目標檢測器的核心是分類器,即給定一個尺寸固定圖片,分類器判斷是不是目標;
(2)將分類器進化爲檢測器的關鍵是:在原始圖像上從多個尺度產生窗口,並resize到固定尺寸,然後送給分類器做判斷。
最常用的方法是滑動窗口-》非極大值抑制NMS,抑制冗餘框-》一個object只保留一個最優的框
(1)將所有框的得分排序,選中最高分及其對應的框
(2)遍歷其餘的框,如果和當前最高分框的重疊面積(IOU)大於一定閾值,我們就將框刪除。
(3)從未處理的框中繼續選一個得分最高的,重複上述過程。
參考:
忘記出處了0.0