論文 : Beyond Correlation Filters:Learning Continuous Convolution Operators for Visual Tracking
該文章的主要思想是將傳統手工特徵換成了 vgg的特徵
但是由於特徵層的分辨率不同,故通過插值將每層特徵轉到 【0,T) 空間,公式如下
其中 xd是d層特徵,Nd爲每層的特徵行列數,bd爲事先計算的權重,插值可以將特徵點精確到亞像素級別
隨後將各個特徵圖和濾波器進行卷起操作,類似於svm求解相應的方式。公式如下:
sf 爲 樣本x的相應值。然後在該相應圖中尋找minMaxLoc,得到最後的置信度。
濾波器的求解方式如下:
其中yi爲label ,具體沒注意,不過參考kcf的話,可以是gauss分佈
aj是訓練樣本的權重
由於本人數學較差,看不懂部分的公式推導,在文章中,E(f)最小化可以等價於器相對每格濾波器
f的傅里葉係數的最小化。最後又等價於最小平方問題
該公式的最小值可以通過求解一下正規方程獲得:
跟蹤框架:
1. 提取樣本,以中心點擴大區域,設置樣本權重 aj = a(j-1)/(1-λ) λ = 0.0075 權重歸一化,
最多存儲 m個樣本。 迭代時更換權重最小的樣本來更新
文章使用5個尺度,比例因子1.02,通過如上的5次計算,獲得最佳尺度。