目標檢測——Sliding Window、RegionProposal、Selective Search、RPN

原創

LS_learner

2020-06-13 17:47

Sliding Window

滑窗法有在傳統中的方法法和在深度學習中的方法，下面講的是在深度學習中的方法。

滑窗法有2個過程：

依次滑動：
每次滑動一個像素點，每個像素都會對應一個框。每次滑動後，都把框框住的內容當作一個圖像送入目標檢測網絡中（如VGG網絡，或者ResNet網絡）進行檢測。檢測結果對應的位置，就是框的位置，每次滑動後，位置就確定了。
多尺度滑動：
那麼每次框的大小如何確定呢？這就是多尺度進行滑動了。就是使用小的框，把整張圖滑動一遍之後，再使用大一點的框，再進行滑動一遍。然後再選擇更大的框，再進行滑動。最後一個尺度，有可能和整個圖的大小差不多。這樣才能檢測出大的、小的目標。

可以看出，窗口的尺度越多，檢測的越全，但是速度會變慢。每次滑動一個像素點，這就會導致檢測窗口會出現大量的冗餘。
那麼如何解決這個問題呢？
OverFeat:

使用卷積的方法來代替滑窗法，利用卷積的高效計算性質，來加快滑窗法的速度。
具體可以看另一篇博客：
https://blog.csdn.net/qq_35732097/article/details/79027095

Region Proposal

從sliding window中，我們可以發現，有很多地方是沒有物體的，但是耶進行了檢測。所以沒有必要對所有的地方都進行檢測，所以就出來了Region Proposal，意思是建議檢測的區域，排除哪些沒有物體的區域。Region Proposal就是通過像素的聚類，把可能是同一類的事物進行聚爲一類。這樣就減少了檢測的範圍。

Selective Search

第一步：先通過Region Proposal，一張圖片中的信息進行聚類，比如說聚類爲200類，這個聚類爲多少類，需要自己來指定。
第二步：對每個聚類的區域進行檢測。

RPN

由於上面的Region Proposal的聚類是傳統的機器學習方法，那麼我們可不可以使用深度學習的方法，讓它自己生成呢。答案是可以的。

具體可以看另一篇博客：
https://blog.csdn.net/JNingWei/article/details/78847696

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

目標檢測——Sliding Window、RegionProposal、Selective Search、RPN

Sliding Window

Region Proposal

Selective Search

RPN

linux安裝cuda和cudnn

模擬手機設備：使用 Playwright 實現移動端自動化測試

Mellanox網卡開啓SR-IOV

測試人員都是畫畫大神，讓我看看誰還不會用代碼圖？

Object.values()對象遍歷

我拍了拍Redis，被移出了羣聊···

網絡現代化通向雲原生應用的高速公路

面試官：說說你對序列化的理解

我宣佈，這是我找到的史上AI最全論文體系！

C++/C之struct和typedef struct

遠程服務器下載百度網盤中的內容

YOLOv3算法原理，源碼精講以及YOLOv4要點（更新階段）

單層LSTM和多層LSTM的輸入與輸出

如何編寫自己的python包，並進行安裝和發佈

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結