未完成——目標檢測 | DetNet算法筆記


會議: ECCV 2018

標題:《DetNet: A Backbone network for Object Detection》

論文鏈接: https://arxiv.org/abs/1804.06215

目錄

主要思想
網絡結構
實驗對比
結論

DetNet:專爲物體檢測而生的網絡框架

主要思想

傳統的網絡框架主要是爲圖像分類而設計的。至於什麼網絡框架更適合於物體檢測,這還是一個探索中的領域。最近的大多基於卷積神經網絡的目標檢測算法,不管是one-stage的算法,像YOLO,SSD 和RetinaNet還是two-stage的Faster RCNN, R-FCN, FPN算法,都是在圖像分類預訓練模型的基礎上進行調優的,但這對於物體檢測來說並不是最優的。因爲在圖像分類和目標檢測中,有很多特徵是不同的。1)最新的目標檢測算法像FPN和RetinaNet,通常需要多加一個stage去解決圖像分類中多尺度目標的問題。2)目標檢測不僅需要識別目標所屬的類別,還需要定位出具體位置。大的降採樣銀子帶來了大的感受野,這對物體分類很有好處,但是會折中空間分辨率,導致無法精確定位出大物體,識別小物體。

這裏,針對上述問題,我們提出了DetNet。DetNet的關鍵就是爲目標檢測設計一個全新的backbone。

詳細講,DetNet 針對不同大小的物體而像 FPN 一樣使用了更多的 stage。即便如此,它優於 ImageNet 預訓練模型的地方在於成功保留了特徵的空間分辨率,但同時也會增加神經網絡的計算和內存成本。爲保證 DetNet 的效率,本文引入了低複雜度的 dilated bottleneck。由此,DetNet 做到了較高分辨率和較大感受野的兼得。

網絡架構

由於分類模型的設計原則並不適用於檢測任務,從而在一些標準網絡比如 VGG 16 和 ResNet 中特徵圖的空間分辨率逐漸降低。因此一些技術如 FPN(如圖 1 A 所示)和 dilation 被應用在這些網絡之中以保證空間分辨率。但是依然存在如下三個問題:
1.backbone 網絡和檢測網絡的 stage 數量不同。
2.大物體可視性較差:過大的下采樣導致大物體看不清邊界地區。
3.小物體不可見:過大的下采樣也可能會丟失小物體的信息

待續。。。

實驗對比

結論

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章