2016-ECCV-SSD

原創

2018-09-04 08:45

整理過R-CNN，Fast R-CNN，Faster R-CNN，Mask R-CNN，YOLO，今天組會彙報了目標檢測另一主要的框架SSD，原本打算像之前一樣，寫一些論文要點，後發現幾篇優質博客，寫的極爲透徹，相比之下，發現自己對paper的理解並沒有那麼透徹，還需努力，特別要加強動手實踐能力，只有結合代碼才能知道細節。

背景介紹

SSD是Wei Liu在ECCV2016年提出的一種目標檢測算法，提出之時，相比Faster R-CNN有明顯的速度優勢，相比YOLO又有明顯的mAP優勢，但是現在已經被一系列Faster R-CNN改進版以及YOLO v2，v3超越了（上個月剛出的YOLO v3，速度快到不行，要拜讀一下）。

上面這張圖，可以看出SSD在速度和mAP兩方面還是trade off的，並且目標檢測就兩大塊，R-CNN系列的Two-Stage以及YOLO和SSD系列的Single Shot。

方法概括

從YOLO中繼承了將detection轉換爲regression的思路，實現end-to-end檢測
基於Faster R-CNN中的anchor box，提出相似的default box
加入基於SPPNet的檢測方式，在多個大小不同的feature map上同時進行softmax分類和位置迴歸。（這也是論文最核心的貢獻）

方法細節

Architecture

之前YOLO在卷積層後接全連接層，檢測時只利用了最高層feature map，而SSD採用金字塔結構進行檢測，檢測時利用了6個大小不同的feature maps（上圖架構和代碼有些差別），在多個feature maps上進行分類和迴歸。

Default box

SSD中default box和Faster R-CNN中的anchor box非常類似，具體介紹見一文讀懂Faster R-CNN，不過有一些不同之處：

Faster R-CNN中設置9個不同尺寸大小和長寬比的anchor boxs，SSD中是6個，有部分feature maps是4個，至於爲什麼，可能是實驗得出。
SSD中由於涉及多個feature map，因此每個feature map對應的default box的min_size和max_size由以下公式決定（m是feature map數量，m=6）：

$s k = s m i n + s m a x - s m i n m - 1 (k - 1), k \in [1, m]$
在論文中，smin=0.2，smax=0.9

Training

Loss：

SSD loss和Faster R-CNN loss其實是一樣的，分爲classfication loss和location loss兩部，具體介紹見一文讀懂Faster R-CNN

Matching strategy：

在訓練時，ground truth boxes與default boxes按照如下方式進行配對：

找到與每一個ground truth box有最大IoU的default box，保證一一配對
剩餘沒有配對的default box中，選擇與任意ground truth box的IoU大於0.5的default box作爲正樣本
配對到的就是positive，沒有配對到的就是negative

Hard negative mining：

由於負樣本很多，需要去掉一部分負樣本，整張圖經過網絡，根據confidence score排序default box，選擇confidence score高的box進行訓練，這樣篩選出來的負樣本也會更難識別，並且最終正負樣本比例爲1：3

Data augmentation:

數據增強，即沒一張訓練圖像，隨機的進行如下幾種選擇：

使用原始的圖像
crop圖像上的一部分，與物體之間最小的IoU爲：0.1，0.3，0.5，0.7，0.9
隨機crop

方法的侷限性

需要人工設置default box的min_size，max_size和aspect_ratio值，調參依靠經驗
小目標檢測一般，作者認爲SSD使用低層feature map去檢測小目標，存在提取不充分的問題

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

2016-ECCV-SSD

相關鏈接

背景介紹

方法概括

方法細節

Architecture

Default box

Training

方法的侷限性

2012-NSDI-RDD

常用Linux命令--刪除及清理

常用Linux命令--解壓

本地訪問服務器jupyter notebook

循環神經網絡2--LSTM

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結