DeepSort 解讀

1 摘要

DeepSort是在Sort目標追蹤基礎上的改進。引入了在行人重識別數據集上離線訓練的深度學習模型,在實時目標追蹤過程中,提取目標的表觀特徵進行最近鄰匹配,可以改善有遮擋情況下的目標追蹤效果。同時,也減少了目標ID跳變的問題。

2 核心思想

算法的核心思想還是用一個傳統的單假設追蹤方法,方法使用了遞歸的卡爾曼濾波和逐幀的數據關聯。

2.1 軌跡處理和狀態估計

該部分的思路和sort很接近。

  • 運動狀態估計:

使用8個參數
在這裏插入圖片描述
來進行運動狀態的描述,其中(u,v)是bounding box的中心座標,r是長寬比,h表示高度。其餘四個變量表示對應的在圖像座標系中的速度信息。使用一個基於常量速度模型和線性觀測模型的標準kalman濾波器進行目標運動狀態的預測,預測的結果爲(u,v,r,h)。

  • 目標的創建與移除
    對每一個追蹤目標,記錄自其上一次檢測結果與追蹤結果匹配之後的幀數akakakakak a_kλ=0,Amax=30

    和sort對比,好處是:
    • 減少了45%的ID switch;

    • 結合了深度外觀信息,對遮擋目標的追蹤效果大大提升;

    • FP的升高很多,文章中提出這主要是由於靜態場景中detection的錯誤以及過長的允許丟失的track age所導致的(相對於SORT只用相鄰幀進行匹配來說,Deep SORT允許高達30幀的丟失,而Kalman的等速運動模型沒有改變,這主要造成了FP的升高)。

    • 20Hz,依舊實用;

    • 達到了state-of-art online tracking的效果。

    以下是deepsort的工作過程
    在這裏插入圖片描述
    1.讀取當前幀目標檢測框的位置以及各檢測框圖像塊的深度特徵。(這裏實際處理時要自己來提取)

    2 根據置信度對檢測框過濾,對置信度不夠高的檢測框和特徵予以刪除

    3.對檢測框進行非極大抑制,消除一個目標多個框(這裏如果用python的接口,可以省去着一個環節)

    4 預測:使用kalman濾波預測目標在當前幀的位置

    轉自:https://blog.csdn.net/cdknight_happy/article/details/79731981

                                    </div><div><div></div></div>
                <link href="https://csdnimg.cn/release/phoenix/mdeditor/markdown_views-60ecaf1f42.css" rel="stylesheet">
                                </div>
    </article>
    
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章