深度學習算法原理——RCNN

相比較於圖像分類來說,目標檢測(Object Detection)不僅需要標記出圖像中的物體(通常使用邊框標記),同時需要指出該物體是什麼。一般比較直觀的想法包括以下的三個步驟:

  • 得到目標的可能區域,稱之爲候選區域;
  • 使用圖像特徵的提取方法提取出候選區域的特徵;
  • 利用分類模型對該候選區域分類;

RCNN(Region with CNN features),又稱爲基於區域的卷積神經網絡,也是基於上述的思路的一種目標檢測的方法,基本的思路如下圖所示:

在這裏插入圖片描述
與上述過程一致,RCNN包括了三個模塊:

  • 區域提名;用於生成與類別無關的區域。
  • CNN;對上述生成的區域提取出特徵。
  • SVM分類器;對提取出的圖像特徵分類。

其基本過程爲從輸入圖像中提出去2000個左右的候選區域,對每一個候選區域計算其特徵,最紅利用分類模型對這個2000個左右的候選區域分類,從而得到最終的檢測目標以及每一個目標對應的類別。

1. 區域提名的方法

在RCNN中,使用的是選擇性搜索作爲區域提名的方法。

2. 減少定位錯誤

在實際過程中,使用Bounding box regression來提升目標框的檢測準確率。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章