論文筆記Learning to Track at 100 FPS with Deep Regression Networks

1. 論文標題及來源

Learning to Track at 100 FPS with Deep Regression Networks, ECCV, 2016.
下載地址:https://davheld.github.io/GOTURN/GOTURN.pdf

2. 擬解決問題

a. 大多數方法在線訓練模型,未充分利用數據集

3. 解決方法

3.1 算法流程

在這裏插入圖片描述
a. 從上一幀中裁剪出target
b. 以上一幀target的中心爲search region的中心,search region的高和寬都是target的2倍
c. 使用卷積網絡分別提取他們的特徵,然後輸入到FC層直接回歸目標的位置,即輸出目標在當前幀的位置
FC層的目的是爲了比較object的特徵和當前幀的特徵,以找到object被移動到了哪裏。FC層學習到的是一個複雜的特徵比較函數,輸出目標的相對運動。

4. 實驗結果

4.1 VOT2014

在這裏插入圖片描述
在這裏插入圖片描述

4.2 消融實驗

在這裏插入圖片描述

6. 總結

該算法流程非常簡單,通過卷積網絡提取特徵,然後使用FC學習一個複雜的特徵比較函數,最後直接輸出目標在當前幀的位置

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章