目標檢測Object Detection in 20 Years: A Survey——學習筆記

原創

2020-06-10 17:34

資料參考：

1、https://blog.csdn.net/qq_38906523/article/details/79971817

2、原文：https://arxiv.org/abs/1905.05055 201905的pami

3、https://blog.csdn.net/u013049912/article/details/83275319

4、《Object Detection in 20 Years: A Survey》翻譯版

5、https://blog.csdn.net/Julialove102123/article/details/92838070

6、https://blog.csdn.net/weixin_42662134/article/details/90479543

7、密歇根大學40頁《20年目標檢測綜述》最新論文，帶你全面瞭解目標檢測方法

8、論文筆記-2019-Object Detection in 20 Years: A Survey

目錄

2. 目標檢測的二十年

2.1.1 傳統的目標檢測

2.1.2 基於CNN的兩階段檢測器

2.1.3 基於CNN的one-stage檢測器

2.2 目標檢測的數據集和指標

2.2.1 Metrics指標

2.3 目標檢測的技術演進

2.3.3 邊界框迴歸的技術演進

2.3.4 語義提取的技術演進

5.1 行人檢測

abstract：

作爲計算機視覺中最基本和最具挑戰性的問題之一，目標檢測近年來受到了極大的關注。它在過去二十年的發展可以看作是計算機視覺歷史的縮影。如果我們將當今的物體檢測視爲在深度學習的力量下的技術美學，那麼將時光倒流到20年前，我們將見證冷武器時代的智慧。鑑於對象檢測技術的發展，本文跨越了四分之一個世紀的時間（從1990年代到2019年），對400多篇論文進行了廣泛的評論。本文涵蓋了許多主題，包括歷史上的里程碑檢測器，檢測數據集，度量，檢測系統的基本構建塊，加速技術以及最新的檢測技術水平。本文還回顧了一些重要的檢測應用程序，例如行人檢測，面部檢測，文本檢測等，並對它們的挑戰以及近年來的技術改進進行了深入分析。

milestone detectors，detection datasets, metrics, detection system blocks, speed up, state-of-art method
pedestrain detection, face detection, text detection

1 Introduction

對象檢測是一項重要的計算機視覺任務，用於檢測數字圖像中特定類別的視覺對象（例如人，動物或汽車）的實例。目標檢測的目的是開發能夠提供計算機視覺應用程序所需的最基本信息之一的計算模型和技術：what objects are where?

作爲計算機視覺的基本問題之一，目標檢測構成了許多其他計算機視覺任務的基礎，例如實例分割[1-4]，圖像標題[5-7]，目標跟蹤[8]等。從應用的角度來看，物體檢測可分爲兩個研究主題“通用物體檢測”和“檢測應用”，前者旨在探索在統一框架下對不同類型物體進行檢測的方法，以仿真人類的視覺和認知，後一種指的是特定應用場景下的檢測，例如行人檢測，面部檢測，文本檢測等。近年來，深度學習技術的飛速發展[9]帶來了新的血液進入物體檢測，導致卓越突破，並將其推向研究熱點，受到了前所未有的關注。現在，對象檢測已廣泛用於許多實際應用中，例如自動駕駛，機器人視覺，視頻監控等。圖1顯示了在過去的二十年中與“對象檢測”相關的出版物數量不斷增長。

與其他相關綜述文章不同之處在於：

2. 目標檢測的二十年

2.1.1 傳統的目標檢測

HOG是一種特徵變換，它不隨尺度變化而變化。爲了在特徵不變特性和非線性，即既要保持特徵不隨尺度變化的特性，又想要HOG在不同類別的目標上具有可區分性。歸一化會破壞掉絕對值。

HOG的歸一化是爲了去除光照的影響
但是絕對值被幹掉之後，不同的目標的HOG特徵可能區分性就會減弱
HOG是檢測窗保持不變，即輸入HOG的圖像大小是固定的，通過resize圖像來檢測多尺度目標

2.1.2 基於CNN的兩階段檢測器

RCNN->SPPNet->Fast RCNN->Faster RCNN->FPN

RCNN：選擇性搜索候選框，resize到固定尺寸送入CNN中提取特徵，SVM進行分類和預測。
計算量很大，一個圖有2K個候選框都要單獨送入網絡，導致模型非常慢，GPU=1/14fps。

2.1.3 基於CNN的one-stage檢測器

2.2 目標檢測的數據集和指標

2.2.1 Metrics指標

2.3 目標檢測的技術演進

HOG，VJ是檢測固定長寬比的目標
要想檢測各種長寬比的目標：方法一，混合模型，通過訓練多個模型來檢測不同長寬比的物體；
方法二，採用基於exemplar-based detection，基於範例的檢測方法，爲訓練集的每個對象實例訓練單獨的模型。
類別太多了怎麼辦？能否存在一種統一的多尺度方法來檢測不同長寬比的目標呢？
- 下面的object proposals

類別太多了怎麼辦？能否存在一種統一的多尺度方法來檢測不同長寬比的目標呢？
- 下面的object proposals

2.3.3 邊界框迴歸的技術演進

2.3.4 語義提取的技術演進

5 applications

5.1 行人檢測

小行人：Caltech中，只有15%的行人身高<30 pixel，但是我們的應用場景中幾乎全都是<30 pixel height的數據
難例：與行人特徵相似的背景在我們的應用場景中經常出現
密集行人和遮擋問題

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

行人檢測（3）——數據集

1. HOG+SVM使用的行人識別數據集（1） INRIA Person Dataset（INRIA行人數據庫）——可見光數據集，樣本大小128*64 2. 紅外行人數據集：KAIST Multispectral Pedestrain

2020-06-28 02:06:26

SVM多分類原理學習

https://scikit-learn.org/stable/modules/svm.html https://sklearn.apachecn.org/docs/master/5.html 中文翻譯 SVC，NuSVC，Linea

2020-06-16 04:21:05

數據集隨機+比例分爲訓練集和測試集：並分別存爲文件夾

需求：將數據集隨機分爲訓練集和測試集，並將隨機分類的圖像保存至對應的文件夾。讓train+test=原始數據，且帶有隨機比例。原因：需要將初始化數據集隨機分配之後，再將訓練集做數據增光，所以不能直接採用txt隨機生成路徑的方式。原始數

2020-06-12 19:35:38

《CV項⽬實戰》——有三AI，臉部表情識別

整體的感受：（1）一個簡單的CNN的圖像分類已經有所接觸了，識別人臉和識別嘴脣的部分有預處理了（2）然後摳出ROI的區域送入分類器，25%的背景padding，也有resize的部分，resize到同一個尺寸（3）深度學習大部分就是

2020-06-10 17:34:13

行人和車輛的分類——數據集分類

考慮因素：沒有考慮騎自行車的、兩輪摩托車、三輪摩托車的等。這些因素都是要排列組合疊加的，然後這樣準備數據。目的：都是爲了讓訓練出來的模型泛化能力更強，能夠應對各種實際情況！行人數據集的考慮因素距離：200m~1km，體現在像素上就是

2020-06-10 17:34:13

CV研究方向及綜述

計算機視覺的方向：圖像分類、目標檢測、圖像分割、目標跟蹤、圖像去噪、圖像增強、風格化、三維重建、圖像檢索、GAN 實際中的圖像分類，如表情分類。用的是人臉和嘴部的location，這就是目標檢測的先驗在。同時HOG行人檢測也是用來HOG+

2020-06-10 17:34:13

行人和車輛檢測的一些資料閱讀——如何解決多尺度的問題？

1. 車輛識別（特徵提取+svm分類器） 2. 如何用點雲對車輛和行人進行識別分類？這是MIT學生的總結 3. HOG + SVM 做目標檢測、車輛檢測主要考慮的因素是距離遠近不同的車輛的識別策略：處理scale的問題。 HOG特徵並

2020-06-10 17:34:13

基於SVM的cifar10分類

備註：閱讀博客後的筆記，代碼來自他人博客。 1. 基於線性SVM的cifar10圖像分類博客爲：svm實現圖片分類（python）博客對應的代碼倉庫：https://github.com/452896915/cs231n_course

2020-06-10 17:34:13

紅外圖像處理——製作切片數據集

1、數據集：flir adas的數據集，coco數據集格式。

2020-06-10 17:34:13

基於SVM的圖像分類——一些注意事項

與項目本身有關的 CS231n的四個作業：https://blog.csdn.net/lvyshanwm/category_9769930.html CS231n作業紅色石頭的博客：https://blog.csdn.net/red_s

2020-06-10 17:34:13

視頻軌跡跟蹤分析——他山之石

2020-05-20 13:32:10

紅外行人檢測HOG+SVM（6）——定指標

2020-05-20 13:32:10

批量讀取文件的代碼

2020-05-20 13:32:10

紅外行人檢測HOG+SVM（5）—— 如何根據自己的數據集分析和優化模型

2020-05-17 08:24:09

BU-TIVThermal Infrared video benchmark BU-TIV數據集

2020-05-12 19:27:10

24小時熱門文章

最新文章

最新評論文章