Note_0529

【多尺度目標檢測】

在使用Faster-RCNN訓練自己數據時,如果相機採集圖片位置發生變化,會影響測試效果,於是開始找尋可以解決這一問題的辦法。最新調研成果如下:

  1. SSD在最後7*7的輸出特徵後,繼續加一些不同大小的卷積層,讓最後這幾層卷積同時爲目標檢測做出判斷。這樣,就可以識別各個尺度大小的物體(大物件或小物件)[1]。也就是說,SSD通過更改卷積層的結構,對各個尺度大小物體進行識別。
  2. 使用FPN(特徵金字塔網絡)這種網絡不是一味地進行下采樣提取語義特徵去識別物體,而是從頂層(自上而下)的每一層都進行上採樣獲取更準確的像素位置信息[2]。但是這個方法存在的問題就在於增大了計算量。
  3. 爲了緩解這樣的計算壓力並且對多尺度物體更精準地識別,SNIPER另闢蹊徑,對每個尺度大類下都維護一個重點關注區域(region)[2]。
    SNIPER論文鏈接:https://arxiv.org/pdf/1805.09300.pdf
    SNIPER實現代碼:https://github.com/mahyarnajibi/SNIPER
    FPN論文鏈接:https://arxiv.org/pdf/1612.03144.pdf

參考文獻:
[1]http://nooverfit.com/wp/機器視覺-目標檢測補習貼之ssd實時檢測-multibox-single-shot-detector/
[2]http://nooverfit.com/wp/聊聊目標檢測中的多尺度檢測(multi-scale),從yolo,ssd到fpn/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章