基於深度學習的目標檢測算法綜述(一)

   接下來的一系列文章是基於微信公衆號:磐創AI 推送的有關文章進行總結和記錄,現在將總結放在CSDN上爲了便於自己查看和學習,同時也希望能起到一份知識傳遞的作用。

  • 背景      

   目標檢測(Object Detection)是計算機視覺領域的基本任務之一,學術界已有將近二十年的研究歷史。近些年隨着深度學習技術的火熱發展,目標檢測算法也從基於手工特徵的傳統算法轉向了基於深度神經網絡的檢測技術。從最初 2013 年提出的 R-CNN、OverFeat,到後面的 Fast/Faster R-CNN、SSD、YOLO 系列,再到 2018 年最近的 Pelee。短短不到五年時間,基於深度學習的目標檢測技術,在網絡結構上,從 two stage 到 one stage,從 bottom-up only 到 Top-Down,從 single scale network 到 feature pyramid network,從面向 PC 端到面向手機端,都涌現出許多好的算法技術,這些算法在開放目標檢測數據集上的檢測效果和性能都很出色。

         首先通過圖1對目標檢測有一個輪廓性的瞭解,接下來針對於不同的部分進行結合論文進行概括。同時會給出每篇論文的出處、錄用信息以及相關的開源代碼鏈接,其中代碼鏈接以磐創AI的作者實現和mxnet實現爲主。

物體檢測的任務是找出圖像或視頻中的感興趣物體,同時檢測出它們的位置和大小,是機器視覺領域的核心問題之一。

物體檢測過程中有很多不確定因素,如圖像中物體數量不確定,物體有不同的外觀、形狀、姿態,加之物體成像時會有光照、遮擋等因素的干擾,導致檢測算法有一定的難度。進入深度學習時代以來,物體檢測發展主要集中在兩個方向:two stage 算法如 R-CNN 系列和 one stage 算法如 YOLO、SSD 等。兩者的主要區別在於 two stage 算法需要先生成 proposal(一個有可能包含待檢物體的預選框),然後進行細粒度的物體檢測。而 one stage 算法會直接在網絡中提取特徵來預測物體分類和位置。

基於深度學習的目標檢測算法綜述分爲三部分:

1. Two/One stage 算法改進。這部分將主要總結在 two/one stage 經典網絡上改進的系列論文,包括 Faster R-CNN、YOLO、SSD 等經典論文的升級版本。

2. 解決方案。這部分歸納總結了目標檢測的常見問題和近期論文提出的解決方案。

3. 擴展應用、綜述。這部分介紹檢測算法的擴展和其他綜述類論文。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章