Tracking算法：Discriminative Correlation Filter (DCF)

基本框架

Minimum Output Sum of Squared Error Filter (MOSSE)

t個目標區域樣本分別爲f1,f2,⋯,ft ，通過濾波器ht ，期望輸出gi （通常爲二維高斯函數，峯值位於目標區域中心），最小化均方誤差：

對Ht 求導，令導數爲0，得：

對於t+1幀，假設其在第t幀的目標區域內提取得到特徵圖z，那麼計算ht 與z的相關值

y的最大值的位置即被認爲是t+1幀中目標區域的中心點.
我們保持目標區域尺寸不變，將其中心點進行移動相應位置，就得到了在新幀中的目標區域。對該區域進行特徵提取，然後加入到訓練集中對模型進行更新得到ht+1 後，即可進行下一幀
中的目標檢測了。

在實際的tracking過程中，一般使用如下方法來更新模型:

其中η 爲學習率。

缺點

只使用了灰度作爲特徵，模型所使用的特徵維數太低，難以很好地反映目標的特性。
只估算了目標區域中心點在幀間的平移運動，而沒有考慮目標在運動過程中反映在畫面上的尺度變化，在目標尺度發生改變時難以適應。

Discriminative Scale Space Tracking Filter (DSST)

對MOSSE的改進：

使用fHoG替代灰度（通常fHoG爲31dims，而DSST實際使用28dims）
考慮目標尺度變化

不考慮尺度變化

設特徵維數爲d，則特徵圖可記作fl,l=1,2,⋯,d 。濾波器應和特徵圖匹配，誤差函數：

引入λ 項是爲了控制濾波器頻域參數求解過程中的除0，另一方面也可以控制濾波器參數變化範圍，λ 越小，濾波器參數變化範圍越大。
對上式做傅里葉變換，求導，令導數爲0，得：

在實際操作中，可以用下式更新模型：

新幀預測：

考慮尺度變化

濾波器和特徵圖由d×M×N 改爲d×M×N×S ，S = num of scales，即構造金字塔。這導致複雜度增大爲O(dMNS×logMNS) 。

改進思路，兩組濾波器模板：

d個大小爲M×N 的二維位置濾波器
d×M×N 個大小爲S的一維尺度濾波器

位置濾波器的訓練方法同前，而尺度濾波器則是在確定了目標區域中心後，對於尺度因子s，提取出其對應區域的d個M×N 的二維矩陣後，將其拉成一條向量，作爲尺度因子s下的d×M×N 維特徵，構成尺度濾波器。

完整算法

估算位置
- 在幀It 中根據前一幀的位置pt−1 和尺度因子st−1 劃定區域提取特徵zlocat
- 在zlocat 與位置濾波器Alocat−1,Blocat−1 做相關得到ylocat
- 將ylocat 最大值點設爲當前幀的目標中心pt
估算尺度
- 在幀It 中根據位置pt 和前一幀的尺度因子st−1 劃定區域，縮放後得到S個區域，提取特徵zscalet
- 將徵zscalet 與尺度濾波器Ascalet−1,Bscalet−1 做相關得到yscalet
- 將yscalet 最大值點設爲當前幀的目標尺度st
更新模型
- 在幀It 中根據估算出的位置pt 和尺度st 劃定區域提取特徵，得到flocat 和fscalet
- 更新位置濾波器得到Alocat,Blocat
- 更新尺度濾波器得到Ascalet,Bscalet

複雜度O(dMN×logMN+dMNS×logS)

缺點

難以適應大幅度形變、遮擋等
循環卷積邊緣效應

SRDCF對此做出了改進。

Spatially Regularized Discriminative Correlation Filter (SRDCF)

將濾波器模板參數主要集中在一個搜索區域中的目標區域（即中心附近），在目標區域以外的背景區域處濾波器模板參數應儘可能地小或者爲0（示意圖如下）。

定義新的誤差函數形式：

其中w 是我們指定的權重函數，由於我們希望hlt 在目標區域儘可能大，在其他搜索區域儘可能小，因此w 的取值應該在目標區域儘可能小，而在其他搜索區域儘可能大，如下圖：

一般可取：

對誤差函數做傅里葉變換（對於某個變量a ，a^ 表示a 的傅里葉變換）：

經過一系列變換：

其中，對於某個變量a ，a⃗ 表示a 向量化的結果。向量化的步驟是：