2016-ECCV-SSD

整理過R-CNN,Fast R-CNN,Faster R-CNN,Mask R-CNN,YOLO,今天組會彙報了目標檢測另一主要的框架SSD,原本打算像之前一樣,寫一些論文要點,後發現幾篇優質博客,寫的極爲透徹,相比之下,發現自己對paper的理解並沒有那麼透徹,還需努力,特別要加強動手實踐能力,只有結合代碼才能知道細節。

相關鏈接

Paper: http://arxiv.org/abs/1512.02325

Code: https://github.com/weiliu89/caffe/tree/ssd

Slides:http://www.cs.unc.edu/~wliu/papers/ssd_eccv2016_slide.pdf

相關博文推薦:

一文讀懂Faster R-CNN(結合論文多看幾遍,收穫頗多)

Single Shot MultiBox Detector(SSD)

背景介紹

SSD是Wei Liu在ECCV2016年提出的一種目標檢測算法,提出之時,相比Faster R-CNN有明顯的速度優勢,相比YOLO又有明顯的mAP優勢,但是現在已經被一系列Faster R-CNN改進版以及YOLO v2,v3超越了(上個月剛出的YOLO v3,速度快到不行,要拜讀一下)。
這裏寫圖片描述

上面這張圖,可以看出SSD在速度和mAP兩方面還是trade off的,並且目標檢測就兩大塊,R-CNN系列的Two-Stage以及YOLO和SSD系列的Single Shot。

方法概括

  1. 從YOLO中繼承了將detection轉換爲regression的思路,實現end-to-end檢測
  2. 基於Faster R-CNN中的anchor box,提出相似的default box
  3. 加入基於SPPNet的檢測方式,在多個大小不同的feature map上同時進行softmax分類和位置迴歸。(這也是論文最核心的貢獻)

方法細節

Architecture

這裏寫圖片描述
之前YOLO在卷積層後接全連接層,檢測時只利用了最高層feature map,而SSD採用金字塔結構進行檢測,檢測時利用了6個大小不同的feature maps(上圖架構和代碼有些差別),在多個feature maps上進行分類和迴歸。

Default box

SSD中default box和Faster R-CNN中的anchor box非常類似,具體介紹見一文讀懂Faster R-CNN,不過有一些不同之處:

  1. Faster R-CNN中設置9個不同尺寸大小和長寬比的anchor boxs,SSD中是6個,有部分feature maps是4個,至於爲什麼,可能是實驗得出。

  2. SSD中由於涉及多個feature map,因此每個feature map對應的default box的min_size和max_size由以下公式決定(m是feature map數量,m=6):


    sk=smin+smaxsminm1(k1),k[1,m]

    在論文中,smin=0.2smax=0.9

Training

Loss:

SSD loss和Faster R-CNN loss其實是一樣的,分爲classfication loss和location loss兩部,具體介紹見一文讀懂Faster R-CNN
這裏寫圖片描述

這裏寫圖片描述
Matching strategy:

在訓練時,ground truth boxes與default boxes按照如下方式進行配對:

  1. 找到與每一個ground truth box有最大IoU的default box,保證一一配對
  2. 剩餘沒有配對的default box中,選擇與任意ground truth box的IoU大於0.5的default box作爲正樣本
  3. 配對到的就是positive,沒有配對到的就是negative

Hard negative mining:

由於負樣本很多,需要去掉一部分負樣本,整張圖經過網絡,根據confidence score排序default box,選擇confidence score高的box進行訓練,這樣篩選出來的負樣本也會更難識別,並且最終正負樣本比例爲1:3

Data augmentation:

數據增強,即沒一張訓練圖像,隨機的進行如下幾種選擇:

  1. 使用原始的圖像
  2. crop圖像上的一部分,與物體之間最小的IoU爲:0.1,0.3,0.5,0.7,0.9
  3. 隨機crop

方法的侷限性

  1. 需要人工設置default box的min_size,max_size和aspect_ratio值,調參依靠經驗
  2. 小目標檢測一般,作者認爲SSD使用低層feature map去檢測小目標,存在提取不充分的問題
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章