論文筆記Learning to Track at 100 FPS with Deep Regression Networks
1. 論文標題及來源
Learning to Track at 100 FPS with Deep Regression Networks, ECCV, 2016.
下載地址:https://davheld.github.io/GOTURN/GOTURN.pdf
2. 擬解決問題
a. 大多數方法在線訓練模型,未充分利用數據集
3. 解決方法
3.1 算法流程
a. 從上一幀中裁剪出target
b. 以上一幀target的中心爲search region的中心,search region的高和寬都是target的2倍
c. 使用卷積網絡分別提取他們的特徵,然後輸入到FC層直接回歸目標的位置,即輸出目標在當前幀的位置
FC層的目的是爲了比較object的特徵和當前幀的特徵,以找到object被移動到了哪裏。FC層學習到的是一個複雜的特徵比較函數,輸出目標的相對運動。
4. 實驗結果
4.1 VOT2014
4.2 消融實驗
6. 總結
該算法流程非常簡單,通過卷積網絡提取特徵,然後使用FC學習一個複雜的特徵比較函數,最後直接輸出目標在當前幀的位置