DSST目標跟蹤--調整目標尺度

原創

2018-12-28 15:55

論文全名：Accurate Scale Estimation for Robust Visual Tracking

論文摘自BMVC 2014，由Martin Danelljan（目標跟蹤大神）、Gustav Häger、Fahad Shahbaz Khan、Michael Felsberg撰寫

摘要

作者提出魯棒尺度估計：通過基於尺度遞增表示來學習相關濾波器。

對於轉換和尺度估計（非固定）分別學習了一個濾波器，提高了性能。

1 前言

（1）tracking-by-detection（目標與背景分類問題）：MOSSE（最小化平方誤差的輸出和）、Struck SVM、CSK（核最小二乘分類）、CT。缺點：對尺度變化序列中表現差。

（2）處理尺度變化：ASLA、SCM。缺點：以低幀速率操作，導致不實時。理想的尺度估算方法應該是穩健的，以便在計算效率的同時進行尺度變化。

作者針對上述問題，提出基於MOSSE相關濾波器的魯棒尺度估計方法。

貢獻：

（1）提出了在尺度金字塔上訓練分類器來評估目標尺度的方法。

（2）在找到最佳轉換後獨立地估計目標尺度。

效果：提高了準確性，幀速率提高了25倍。

測試數據集：OTB2013中標籤爲“Scale Variation”的28個視頻序列。

2 訓練判別濾波器

作者提出的方法是基於MOSSE的，

目的：對第t幀得到最佳相關濾波器。

方法：（與MOSSE處理相同）

（1）取（目標的灰度圖像塊）作爲訓練樣本，期望輸出爲（高斯函數【峯值位於中心】），通過最小化誤差平方和（第二個等式由Parseval定理得出【經過了離散傅立葉變換】）。

（2）定義第t幀的相關分數（逆傅里葉變換），取最大值即可。

解釋：（分子和分母通過對分別加權平均更新得到），大小爲M×N，爲循環相關操作。

3 算法

輸入：第t幀圖像、第t-1幀目標位置、尺度變化；

輸出：第t幀預測的目標位置、尺度變化；

（1）預測目標：

1.通過與，得到第t幀的預測樣本；

2.利用與之前幀的與，用【1】計算相關分數；

3.通過得到第t幀的位置；

（2）尺度計算：

4.通過第3步的與，得到第t幀的尺度樣本；

5.利用與之前幀的與，用【1】計算相關分數；

6.通過得到第t幀的尺度變化；

（3）模型更新：

7.用第t幀的目標位置、尺度變化，計算樣本與；

8.通過【1】計算出與，更新預測目標模型；

9.通過【1】計算出與，更新尺度模型。

【1】多維特徵濾波器

與KCF相同，作者將HOG（對低分辨率處理不佳）用於轉換濾波器，並將其與通常特徵相結合。

具體：利用1維濾波器評估尺度，2維濾波器計算平移，3維濾波器進行目標具體縮放空間定位。

目的：對於d維特徵圖，找到最佳相關濾波器h（對於初始幀，使用第二節中的方法）

方法：

（1）設f爲其目標的一個矩形塊（訓練樣本），包含（），期望輸出爲g，爲對應特徵維度的濾波器，λ=0.01控制正則項。最小化損失函數：。對於轉換濾波器的評估，作者用目標的特徵圖f，訓練了一個HOG濾波器 $h_{trans}=\frac{A^{l}_{t}}{B_{t}}$ ，

（2）相關分數（逆傅里葉變換），取最大值即可。

解釋：計算量較大，引入： $H^{l}_{t}=\frac{A^{l}_{t}}{B_{t}}$ ，其中，，，η=0.0025是學習率。

【2】尺度空間

提出了基於三維的相關濾波器：濾波器大小固定爲M×N×S，其中M和N是濾波器的高度和寬度，S是尺度。

（1）計算目標區域的特徵金字塔（大小爲M×N）

（2）將訓練樣本f設爲特徵金字塔的立方體（M×N×S），以目標的估計位置（通過之前幀的目標位置，用【1】的相關分數計算最大值來獲得）爲中心。

（3）用三維高斯函數作爲相應的期望輸出g。

（4）用 $H^{l}_{t}=\frac{A^{l}_{t}}{B_{t}}$ 更新尺度空間濾波器。

【3】Fast 尺度空間

通過用於轉換和尺度的單獨（一維）濾波器進行fast尺度變換。將搜索區域限制爲比例空間中較小的部分。設P×R表示當前幀中的目標大小，S是尺度濾波器的大小。

設定尺度：

（1）對於每個，取大小爲圖像塊（以目標中心爲中心），a=1.02爲特徵層之間的比例因子。

（2）對於d維特徵描述符，樣本f(n)設爲，n爲尺度值

（3）對f更新縮放濾波器 $h_{scale}=\frac{A^{l}_{t}}{B_{t}}$ 。（在計算 $\bg_white h_{trans}$ 後再計算 $\bg_white h_{scale}$ ）

（4）與f相同，提取z，用【1】的相關分數計算最大值，獲得尺度差異。

【4】細節

1.參數

（1）將期望輸出g的標準差設置爲預測目標濾波器中目標大小的1/16和尺度濾波器的1.5；

（2）濾波器大小M×N爲初始目標的兩倍，S = 33；

（3）對任何序列參數值不變。

2.特徵

（1）使用PCA-HOG（第六節cell大小爲8×8）進行圖像表示，其中，cell大小設爲1×1。

（2）用圖像灰度值進一步增加HOG特徵（【2】尺度空間中也用到）。

（3）對於【3】fast 尺度空間，cell大小設爲4×4，而對大於512像素的初始目標，設定縱橫比尺寸不變（確保最大特徵描述符長度爲992）

（4）與MOSSE相同。提取的特徵都會乘以cos窗。

4 評估

我們首先表明，用HOG功能取代傳統的強度值可以顯着提高性能。然後，我們將快速尺度估算方法與窮舉方法進行比較。最後，我們提供定量和定性比較與最先進的跟蹤器。

【1】平臺

Matlab， Intel Xenon 2 core 2.66 GHz CPU with 16 GB RAM。

【2】評估方法

（1）CLE（中心位置誤差）：GT與估計中心位置的平均歐幾里德距離

（2）DP（距離精度）：CLE小於特定閾值的幀數

（3）OP（IOU）：IOU大於閾值t=0.5的百分比

【3】Baseline=MOSSE+HOG（多維特徵濾波器）

與MOSSE相比，Baseline的CLE從31.2減少到15.9，DP提高了11.6%，OP提高了6.9％。

【4】Fast尺度評估

可以看出，Fast尺度空間的OP、DP、CLE性能最佳，而且相比尺度空間，計算速度提高了24倍。

【5】算法評估

算法：DSST（ours），CT，TLD，DFT，EDFT，ASLA ，L1APG，CSK， SCM，LOT，Struck和LSHT。

結論：雖然ASLA、SCM、Struck在OP、DP與CLE表現不錯，但速度方面卻不敵DSST。

5 結論

作者通過學習一種判別相關濾波器，獨立地估計平移和縮放，而且可以將該方法放入任何跟蹤算法中。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

跟蹤中的主要深度學習模型介紹(一)

深度學習的發展主要經歷了三個重要的時期，從前期深度學習的前身神經網絡的提出後，深度學習發展緩慢；到中期深度學習的迅速發展，取得很多驚人成果；再到深度學習的繁盛時期，深度學習逐漸成爲很多領域的熱門研究問題。前期（1970年~2006年）：

2020-07-04 16:15:58

目標追蹤-CVPR2014-Adaptive Color Attributes for Real-time Visual Tracking

基於自適應顏色屬性的目標追蹤 Adaptive Color Attributes for Real-Time Visual Tracking 基於自適應顏色屬性的實時視覺追蹤 3月講的第一篇論文，個人理解，存在很多問題，歡迎

2020-06-29 09:50:08

【c】kcf定點化小結

文章目錄一、定點關鍵點二、代碼裏計算流程三、定點轉化過程四、實測一、定點關鍵點 fft定點運算高斯濾波核相關函數定點高斯窗函數定點漢寧窗函數定點二、代碼裏計算流程一個重要的思想是將卷積運算轉化到了傅里葉頻域運算，加

2020-07-08 08:19:12

【全文翻譯】PointRNN: Point Recurrent Neural Network for Moving Point Cloud Processing

在這裏我給出我在pytorch框架下實現的計算CD和EMD的cuda加速代碼，本人正在求學，需要在github頁面刷刷經驗，覺得代碼有用的同學麻煩再github給個星星吧！ https://blog.csdn.net/taifen

2020-07-07 16:37:29

Distractor-aware Siamese Networks for Visual Object Tracking（DaSiamRPN)

目標跟蹤中對干擾項敏感的暹羅網絡摘要最近，暹羅網絡(Siamese network)因其平衡的準確性和速度而備受視覺跟蹤領域的關注。但是，大多數暹羅跟蹤方法中使用的特徵只能區分前景和非語義背景。語義背景始終被視爲干擾因素，這阻

2020-07-07 13:29:58

目標跟蹤算法彙總及其相關論文

最近老大要求調研目標跟蹤的算法，做一個數據庫。調研完成後順別貼到博客，供大家參考，格式是“論文發表時間+發表會議+算法簡稱+相關論文” 2002-CVPR-CPF-Color-Based Probabilistic Tracking.pd

走出自动化坑的程序猿

2020-07-05 22:25:39

他人總結的TLD視覺跟蹤算法（源代碼、文章、原理等）非常好的東西

TLD算法好牛逼一個，這裏有個視頻，是作者展示算法的效果，http://www.56.com/u83/v_NTk3Mzc1NTI.html。下面這個csdn博客裏有人做的相關總結，感覺挺好的，收藏了！下面有個Compressive T

2020-07-04 18:41:19

ECO在VOT上的配置問題

ECO下載 https://github.com/martin-danelljan/ECO 另外需要額外下載這個傢伙，要300多M 下載地址：http://www.vlfeat.org/matconvnet/pretrained

2020-06-30 12:28:33

windows下配置pysot

windows下配置pysot 1.下載源碼 https://github.com/STVIR/pysot 2.pycharm打開工程，提示缺少哪個庫，就用pip安裝 3.添加環境變量，系統變量添加PYSOT，然後路徑填寫源碼路

2020-06-28 15:48:02

siamese-fc matlab tracking代碼解讀

siamese-fc matlab tracking代碼解讀 tracking部分包含以下代碼 1.run_tracker.m function run_tracker(video, visualization) % RUN_T

2020-06-28 15:48:01

sort多目標跟蹤代碼解讀

sort多目標跟蹤代碼解讀算法整體流程： 1.讀取每一幀檢測的結果det。其中det.txt如下：第一個數代表幀號，第三個數~第六個數代表目標(x,y,w,h)，第七個數代表得分score,其它數據不詳。 1,-1,500,15

2020-06-28 15:48:01

siamese-fc pytorch代碼運行配置

siamese-fc pytorch代碼運行配置工程文件夾： Car1下面爲 1.代碼下載地址： https://github.com/StrangerZhang/SiamFC-PyTorch 2.下載模型2016-08-

2020-06-28 15:48:00

多目標跟蹤基於cpu實現

多目標跟蹤實現(非opencv_contrib多目標跟蹤模塊) 基於cpu多線程實現。實現流程如下：設置目標跟蹤初始框大小。打開本地視頻或者相機，讀取數據。每當點擊一次圖像中的目標時，初始化一個跟蹤器，然後進入更新狀態。

2020-06-28 15:47:59

siamese-fc matlab代碼運行配置

siamese-fc matlab代碼運行配置 1.安裝vs2015 2.安裝matlab2017b 3.安裝cuda9.0,cudnn 4.下載matconvnet-1.0-beta24.tar.gz 5.下載siamese-f

2020-06-28 15:47:57

mosse跟蹤算法c++實現

mosse跟蹤算法c++實現本文基於c++實現mosse跟蹤算法，參考原工程爲Matlab語言編寫，https://github.com/amoudgl/mosse-tracker。本代碼基本流程與上述工程基本一致。編寫過程

2020-06-28 15:47:57

24小時熱門文章

DAPPER 事務 TRANSACTION

最新文章

最新評論文章