1 摘要
DeepSort是在Sort目標追蹤基礎上的改進。引入了在行人重識別數據集上離線訓練的深度學習模型,在實時目標追蹤過程中,提取目標的表觀特徵進行最近鄰匹配,可以改善有遮擋情況下的目標追蹤效果。同時,也減少了目標ID跳變的問題。
2 核心思想
算法的核心思想還是用一個傳統的單假設追蹤方法,方法使用了遞歸的卡爾曼濾波和逐幀的數據關聯。
2.1 軌跡處理和狀態估計
該部分的思路和sort很接近。
- 運動狀態估計:
使用8個參數
來進行運動狀態的描述,其中(u,v)是bounding box的中心座標,r是長寬比,h表示高度。其餘四個變量表示對應的在圖像座標系中的速度信息。使用一個基於常量速度模型和線性觀測模型的標準kalman濾波器進行目標運動狀態的預測,預測的結果爲(u,v,r,h)。
- 目標的創建與移除
對每一個追蹤目標,記錄自其上一次檢測結果與追蹤結果匹配之後的幀數λ=0,Amax=30
和sort對比,好處是:-
減少了45%的ID switch;
-
結合了深度外觀信息,對遮擋目標的追蹤效果大大提升;
-
FP的升高很多,文章中提出這主要是由於靜態場景中detection的錯誤以及過長的允許丟失的track age所導致的(相對於SORT只用相鄰幀進行匹配來說,Deep SORT允許高達30幀的丟失,而Kalman的等速運動模型沒有改變,這主要造成了FP的升高)。
-
20Hz,依舊實用;
-
達到了state-of-art online tracking的效果。
以下是deepsort的工作過程
1.讀取當前幀目標檢測框的位置以及各檢測框圖像塊的深度特徵。(這裏實際處理時要自己來提取)2 根據置信度對檢測框過濾,對置信度不夠高的檢測框和特徵予以刪除
3.對檢測框進行非極大抑制,消除一個目標多個框(這裏如果用python的接口,可以省去着一個環節)
4 預測:使用kalman濾波預測目標在當前幀的位置
轉自:https://blog.csdn.net/cdknight_happy/article/details/79731981
</div><div><div></div></div> <link href="https://csdnimg.cn/release/phoenix/mdeditor/markdown_views-60ecaf1f42.css" rel="stylesheet"> </div> </article>
-