SRDCF & DeepSRDCF(tracking)

介紹DeepSRDCF之前,首先介紹SRDCF。

今天對SRDCF算法做一些筆記[paper:Learning Spatially Regularized Correlation Filters for Visual Tracking]

這篇文章同樣是目前比較好的,在VOT2015年的排名第四。他是KCF的一種變形[KCF-SRDCF-DeepSRDCF].下面詳細介紹paper.速度4fps.本文主要解決的問題是kcf算法的boundary effects(由循環矩陣導致的),在loss function中引入懲罰項,期望抑制離中心較遠的特徵的影響。

轉載請註明:http://write.blog.csdn.net/postedit/51325716

  • paper 特點
  1. 在KCF/DCF基礎上改善了boundary effects,加入懲罰項[spatial regularization function that penalizes(懲罰) filter coefficients residing outside the target region].
  2. 不同的scale搜索,處理尺度的問題(暴力的分爲指定個尺度,依次匹配)。
  3. 在求解corelation filters時,利用iterative Gauss-Seidel method在線學習。
作者的最重要的貢獻在與第一點。
  • details
  1. 目的: 從一組train samples中學習一個corralation filter[DCF算法,paper中利用的是circular struct+FFT加速運算]。
  2. 由於標準的DCF有許多缺點[boundary effects,容易over-fitting]所以本文在此有所改進,那麼標準的DCF是怎樣的呢?標準的DCF就是一個監督學習,學習一個linear classifier&linear regressor,可是SVM等也是同樣的思想,兩者最大的不同在於DCF利用的時circular correlation 來training and detection.circular correlation filters的兩大優勢爲:第一,訓練樣本多樣化(有各種樣本的平移【KCF】);第二,FFT加速運算,適用於online-tracking.

標準的DCF原理如下:

首先式(1)中,S爲響應值,X爲search region中的特徵,f爲學習的filters係數,‘*’表示循環卷積[可以參見KCF原理],式(2)爲loss function,然後利用循環矩陣來求解[詳細參見KCF算法], 缺點循環卷積帶來boundary effects:

 

 提出SRDCF算法,在DCF的基礎上添加正則化項:空間權重函數(懲罰項,w),將式(2)的式子修改如下:

其中懲罰權重w滿足(負)Gauss分佈,目的是超過邊界的w更大,表示懲罰越大[注意不是label中的高斯分佈,不要弄混淆了],所以歸一化後,loss function如下:

對式(5),利用FFT和循環矩陣的性質進行計算,這樣學習到的濾波係數可視化對比如下:


最終求解等價於求解線性方程組


由於採用circular 算法,某些等式可以簡化,所以提出Gauss-seidel method來簡化【略】。

有了上面的求解,那麼在跟蹤的時候,根據第一幀的ground-truth,就可以進行訓練,迭代等式如下(第一幀的信息可以求迭代需要的初始化的值):

  • test部分

  1. 訓練好了後,用於detection,the location of the target in a new frame t is estimated by applying the filter f ˆ t−1 that has been updated in the previous frame,首先,we apply the filter at multiple resolutions to estimate changes in the target size.則選擇一定的候選框,並做放縮處理,最後crop爲同樣的size[作爲循環矩陣的輸入].
  2. 搜索採用Sub-grid策略,即用t-1的濾波係數,滑動step>1pixel,這樣根據score,大致定位(可以考慮金字塔策略),再在頻域,對每一個尺度,利用如下公式迭代求解最佳匹配的位置:

文章最後利用了多種特徵。In addition to the HOG features used in [12], the submitted variant of SRDCF also employs Colour Names and greyscale features. These features are averaged over the 4 × 4 HOG cells and then concatenated, giving a 42 dimensional feature vector at each cell


DeepSRDCF[Convolutional Features for Correlation Filter Based Visual Tracking]

他是在SRDCF的基礎上,將hand-crafted的特徵換爲CNN的特徵,其他和SRDCF一模一樣,這篇文章對不同的特徵進行了實驗,說明了CNN特徵在解決跟蹤的問題採取底層的特徵效果會比較好,說明了跟蹤問題並不需要太高的語義信息。作者並沒有公佈源代碼,是基於Matconvnet來做的。

  • paper特點
    1.  探索了不同conv的特徵的不同影響,得出利用第一層conv的特徵效果最好。
    2. 利用PCA將第一層的特徵降爲40-D: the DeepSRDCF employs convolutional features from a pre-trained network.A Principal Component Analysis is used to reduce the feature dimensionality of the extracted activations。
發佈了60 篇原創文章 · 獲贊 26 · 訪問量 31萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章