rcnn論文

原創

2020-02-20 16:47

面臨的挑戰：

1、目標檢測窗口生成：

方法一：將檢測任務作爲迴歸問題

方法二：滑動窗

方法三：selective search

2、數據集較少

通過在大的數據集ILSVRC上進行有監督的預訓練

測試模塊的設計：

1、目標建議框的生成：selective search

2、特徵提取：從每個建議區域227x227 提取到4096維特徵。爲了得到統一227x227圖像，採用仿射變換。

3、對於每一個類採用1 vs res svm進行分類。

訓練細節：

1、有監督的預訓練，圖像級別的標籤

2、fine-tune卷積層，將目標分爲21類，iou>0.5 = postive，在mini batch 128 = 32postive +96background

3、分類svm訓練，閾值設置非常重要，直接影響mAP，iou = 0.3。注意訓練svm時候，由於訓練數據比較多，negative數量遠遠大於postive數量，所以採用standard hard negative mining method

錯誤分析：

1、Loc poor location

2、Sim 和相似的類混淆

3、Oth 和不相似的類混淆

4、BG 假陽性

相比於dmp更多的錯誤在於定位誤差，所以下面才用了bounding box的迴歸。

技術關鍵點：

selective search

affine image warping 仿射變換

standard hard negative mini method

如何對bounding box進行迴歸修正

發佈了90 篇原創文章 · 獲贊 31 · 訪問量 9萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

fcn語義分割論文

全卷積網絡：個人認爲本文主要是兩個重點：第一是fcn，全卷積網絡（+上採樣）第二是skip net 首先說全卷積網絡：通常cnn在卷積層後會接上若干全連接層，但是全連接層和卷積層的連接數量是固定的，這也就導致了輸入必須是固定的尺寸

2020-07-03 05:40:43

alexnet 通過深度卷積對ImageNet圖像進行分類

imagenet上使用深度卷積網絡背景介紹目前的數據集太小，而複雜的圖像分類和識別任務需要更多的數據訓練。對於大量的數據又需要容量大的網絡，cnn網絡可以通過調節寬度和深度來調節網絡的容量。cnn相比於標準的前饋網絡有較少的鏈接

2020-07-03 05:40:43

faster rcnn論文

背景：proposals的生成成爲目標檢測的瓶頸。作者祭出faster rcnn = rpn + fast rcnn的結構，本文主要介紹rpn網絡。 rpn網絡同時預測目標的邊界proposal座標和 proposal的得分，並且在訓

2020-07-03 05:40:43

參數更新方法

代碼實現 https://github.com/hsmyy/zhihuzhuanlan/blob/master/momentum.ipynb 1、梯

2020-07-03 05:40:43

batch normalization論文

2020-02-20 16:47:28

yolo論文

2020-02-20 16:47:28

googlenet 論文

2020-02-20 16:47:27

network in network論文

2020-02-20 16:47:27

overfeat論文待續

2020-02-20 16:47:26

前饋網絡訓練的困難

2020-02-20 16:47:26

resnet 論文

2020-02-20 16:47:26

深度神經網絡的權重初始化

2020-02-20 16:47:26

visualizing and understanding convolution network論文

2020-02-20 16:47:26

fast rcnn論文

2020-02-20 16:47:26

fcn語義分割論文

全卷積網絡：個人認爲本文主要是兩個重點：第一是fcn，全卷積網絡（+上採樣）第二是skip net 首先說全卷積網絡：通常cnn在卷積層後會接上若干全連接層，但是全連接層和卷積層的連接數量是固定的，這也就導致了輸入必須是固定的尺寸

2020-07-03 05:40:43

24小時熱門文章

最新文章

最新評論文章