目標檢測——Sliding Window、RegionProposal、Selective Search、RPN

Sliding Window

滑窗法有在傳統中的方法法和在深度學習中的方法,下面講的是在深度學習中的方法。
在這裏插入圖片描述
滑窗法有2個過程:

  • 依次滑動:
    每次滑動一個像素點,每個像素都會對應一個框。每次滑動後,都把框框住的內容當作一個圖像送入目標檢測網絡中(如VGG網絡,或者ResNet網絡)進行檢測。檢測結果對應的位置,就是框的位置,每次滑動後,位置就確定了。
  • 多尺度滑動:
    那麼每次框的大小如何確定呢?這就是多尺度進行滑動了。就是使用小的框,把整張圖滑動一遍之後,再使用大一點的框,再進行滑動一遍。然後再選擇更大的框,再進行滑動。最後一個尺度,有可能和整個圖的大小差不多。這樣才能檢測出大的、小的目標。

可以看出,窗口的尺度越多,檢測的越全,但是速度會變慢。每次滑動一個像素點,這就會導致檢測窗口會出現大量的冗餘。
那麼如何解決這個問題呢?
OverFeat:
在這裏插入圖片描述
使用卷積的方法來代替滑窗法,利用卷積的高效計算性質,來加快滑窗法的速度。
具體可以看另一篇博客:
https://blog.csdn.net/qq_35732097/article/details/79027095

Region Proposal

在這裏插入圖片描述
從sliding window中,我們可以發現,有很多地方是沒有物體的,但是耶進行了檢測。所以沒有必要對所有的地方都進行檢測,所以就出來了Region Proposal,意思是建議檢測的區域,排除哪些沒有物體的區域。Region Proposal就是通過像素的聚類,把可能是同一類的事物進行聚爲一類。這樣就減少了檢測的範圍。

Selective Search

第一步:先通過Region Proposal,一張圖片中的信息進行聚類,比如說聚類爲200類,這個聚類爲多少類,需要自己來指定。
第二步:對每個聚類的區域進行檢測。

RPN

由於上面的Region Proposal的聚類是傳統的機器學習方法,那麼我們可不可以使用深度學習的方法,讓它自己生成呢。答案是可以的。
在這裏插入圖片描述
具體可以看另一篇博客:
https://blog.csdn.net/JNingWei/article/details/78847696

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章