DSST目標跟蹤--調整目標尺度

論文全名:Accurate Scale Estimation for Robust Visual Tracking

論文摘自BMVC 2014,由Martin Danelljan(目標跟蹤大神)、Gustav HägerFahad Shahbaz KhanMichael Felsberg撰寫

摘要

作者提出魯棒尺度估計:通過基於尺度遞增表示來學習相關濾波器。

對於轉換和尺度估計(非固定)分別學習了一個濾波器,提高了性能。

1  前言

(1)tracking-by-detection(目標與背景分類問題):MOSSE(最小化平方誤差的輸出和)、Struck SVM、CSK(核最小二乘分類)、CT。缺點:對尺度變化序列中表現差。

(2)處理尺度變化:ASLA、SCM。缺點:以低幀速率操作,導致不實時。理想的尺度估算方法應該是穩健的,以便在計算效率的同時進行尺度變化。

作者針對上述問題,提出基於MOSSE相關濾波器的魯棒尺度估計方法。

貢獻:

(1)提出了在尺度金字塔上訓練分類器來評估目標尺度的方法。

(2)在找到最佳轉換後獨立地估計目標尺度。

效果:提高了準確性,幀速率提高了25倍。

測試數據集:OTB2013中標籤爲“Scale Variation”的28個視頻序列 。

2  訓練判別濾波器

作者提出的方法是基於MOSSE的,

目的:對第t幀得到最佳相關濾波器

方法:(與MOSSE處理相同)

(1)取(目標的灰度圖像塊)作爲訓練樣本,期望輸出爲(高斯函數【峯值位於中心】),通過最小化誤差平方和(第二個等式由Parseval定理得出【經過了離散傅立葉變換】)。

(2)定義第t幀的相關分數(逆傅里葉變換),取最大值即可。

解釋:(分子和分母通過對分別加權平均更新得到),大小M×N爲循環相關操作。

3  算法

輸入:第t幀圖像、第t-1幀目標位置、尺度變化

輸出:第t幀預測的目標位置、尺度變化

(1)預測目標:

1.通過,得到第t幀的預測樣本

2.利用與之前幀的,用【1】計算相關分數

3.通過得到第t幀的位置

(2)尺度計算:

4.通過第3步的,得到第t幀的尺度樣本

5.利用與之前幀的,用【1】計算相關分數

6.通過得到第t幀的尺度變化

(3)模型更新:

7.用第t幀的目標位置、尺度變化,計算樣本

8.通過【1】計算出,更新預測目標模型;

9.通過【1】計算出,更新尺度模型。

【1】多維特徵濾波器

KCF相同,作者將HOG(對低分辨率處理不佳)用於轉換濾波器,並將其與通常特徵相結合。

具體:利用1維濾波器評估尺度,2維濾波器計算平移,3維濾波器進行目標具體縮放空間定位。

目的:對於d維特徵圖,找到最佳相關濾波器h(對於初始幀,使用第二節中的方法)

方法:

(1)設f爲其目標的一個矩形塊(訓練樣本),包含),期望輸出爲g,爲對應特徵維度的濾波器,λ=0.01控制正則項。最小化損失函數:。對於轉換濾波器的評估,作者用目標的特徵圖f,訓練了一個HOG濾波器h_{trans}=\frac{A^{l}_{t}}{B_{t}}

(2)相關分數(逆傅里葉變換),取最大值即可。

解釋:計算量較大,引入H^{l}_{t}=\frac{A^{l}_{t}}{B_{t}}其中,,η=0.0025是學習率。

【2】尺度空間

提出了基於三維的相關濾波器:濾波器大小固定爲M×N×S,其中M和N是濾波器的高度和寬度,S是尺度。

(1)計算目標區域的特徵金字塔(大小爲M×N)

(2)將訓練樣本f設爲特徵金字塔的立方體(M×N×S),以目標的估計位置(通過之前幀的目標位置,用【1】的相關分數計算最大值來獲得)爲中心。

(3)用三維高斯函數作爲相應的期望輸出g。

(4)用H^{l}_{t}=\frac{A^{l}_{t}}{B_{t}}更新尺度空間濾波器。

【3】Fast 尺度空間

通過用於轉換和尺度的單獨(一維)濾波器進行fast尺度變換。將搜索區域限制爲比例空間中較小的部分。設P×R表示當前幀中的目標大小,S是尺度濾波器的大小。

設定尺度

(1)對於每個,取大小爲圖像塊(以目標中心爲中心),a=1.02爲特徵層之間的比例因子。

(2)對於d維特徵描述符,樣本f(n)設爲,n爲尺度值

(3)對f更新縮放濾波器h_{scale}=\frac{A^{l}_{t}}{B_{t}}。(在計算\bg_white h_{trans}後再計算\bg_white h_{scale}

(4)與f相同,提取z,用【1】的相關分數計算最大值,獲得尺度差異。

【4】細節

1.參數

(1)將期望輸出g的標準差設置爲預測目標濾波器中目標大小的1/16和尺度濾波器的1.5;

(2)濾波器大小M×N初始目標的兩倍,S = 33;

(3)對任何序列參數值不變。

2.特徵

(1)使用PCA-HOG(第六節cell大小爲8×8)進行圖像表示,其中,cell大小設爲1×1。

(2)用圖像灰度值進一步增加HOG特徵(【2】尺度空間中也用到)。

(3)對於【3】fast 尺度空間,cell大小設爲4×4,而對大於512像素的初始目標,設定縱橫比尺寸不變(確保最大特徵描述符長度爲992)

(4)與MOSSE相同。提取的特徵都會乘以cos窗。

4  評估

我們首先表明,用HOG功能取代傳統的強度值可以顯着提高性能。然後,我們將快速尺度估算方法與窮舉方法進行比較。最後,我們提供定量和定性比較與最先進的跟蹤器。

【1】平臺

Matlab, Intel Xenon 2 core 2.66 GHz CPU with 16 GB RAM。

【2】評估方法

(1)CLE(中心位置誤差):GT與估計中心位置的平均歐幾里德距離

(2)DP(距離精度):CLE小於特定閾值的幀數

(3)OP(IOU):IOU大於閾值t=0.5的百分比

【3】Baseline=MOSSE+HOG(多維特徵濾波器)

與MOSSE相比,Baseline的CLE從31.2減少到15.9,DP提高了11.6%,OP提高了6.9%。

【4】Fast尺度評估

可以看出,Fast尺度空間的OP、DP、CLE性能最佳,而且相比尺度空間,計算速度提高了24倍。

【5】算法評估

算法:DSST(ours),CT,TLD,DFT,EDFT,ASLA ,L1APG,CSK, SCM,LOT,Struck和LSHT。

結論:雖然ASLA、SCM、Struck在OP、DP與CLE表現不錯,但速度方面卻不敵DSST。

5  結論

作者通過學習一種判別相關濾波器,獨立地估計平移和縮放,而且可以將該方法放入任何跟蹤算法中。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章