視頻中的目標檢測與跟蹤綜述

轉自:https://blog.csdn.net/ms961516792/article/details/82682451

 

 

 

 

三、相關方法-Part Two

1、目標跟蹤相關方法

(1)生成式方法

生成式模型通常尋找與目標(待跟蹤目標)最相似的候選作爲跟蹤結果,這一過程可以視爲模板匹配。
在目標跟蹤早期,主要是各種生成式方法,生成式方法都採用不訓練、在線更新的方法,而且都是在CPU上進行計算,模型的速度很快,最快的可以達到2000+FPS。

(2)判別式方法

判別式模型通過訓練一個分類器去區分目標與背景,選擇置信度最高的候選樣本作爲預測結果。
從最近幾年的論文和相關競賽中可以看出,判別式方法基本已經“一統天下”,現在的目標跟蹤是相關濾波和深度學習的時代。

2、生成式方法主要包括均值漂移、卡爾曼濾波、粒子濾波和稀疏編碼。

判別式方法主要包括相關濾波、深度學習和深度學習+相關濾波。

3、均值漂移——Mean Shift

CVPR 2000:Real-Time Tracking of Non-Rigid Objects Using Mean Shift.

Mean Shift是早期的目標跟蹤算法,是一種基於概率密度分佈的跟蹤方法,使目標的搜索一直沿着概率梯度上升的方向,迭代收斂到概率密度分佈的局部峯值上。首先,Mean Shift會對目標進行建模,比如利用目標的顏色分佈來描述目標,然後計算目標在下一幀圖像上的概率分佈,從而迭代得到局部最密集的區域。

它的關鍵部分和它的名字一樣,就這兩個部分,分別是mean(求質心)和shift(向質心方向移動)。

RGB對光照的變化比較敏感,相比之下HSV空間(色調H、飽和度S、亮度V)更適合做目標跟蹤。

Mean Shift能應用到目標跟蹤領域,是因爲反向投影圖。

什麼是反向投影圖?反向投影圖的每個像素值體現了該像素屬於被跟蹤目標的概率。

如何計算反向投影圖?

a、統計目標box區域內H(色調)分量的直方圖,橫座標是色調變量(0\sim 360^{\circ}),縱座標是該色調值下的像素個數,最後再對其進行歸一化,使得該直方圖成爲概率直方圖。

b、將下一幀圖片的所有像素從RGB空間映射到HSV空間。

c、將第二步得到的HSV圖轉換爲反向投影圖。比如(x=1,y=1)位置的H分量是40^{\circ},那麼就將該位置的值替換爲第1步中概率直方圖中40^{\circ}對應的概率。

根據初始目標box的大小和位置確定搜索窗口的大小和位置。

a、Mean.加權平均法計算搜索窗口的質心。

b、Shift.將質心作爲新的搜索窗口中心。

c、Iter.重複a和b直至質心的位置收斂。

4、均值漂移——Cam Shift

WACV 2002:Real Time Face and Object Tracking as a Component of a Perceptual User Interface.

 Cam Shift,即Continuously Adaptive Mean-Shift算法(連續自適應的Mean-Shift)

Mean Shift在目標跟蹤的過程中在每一幀中得到的目標box的大小一直不變,對目標的尺度變化不具有魯棒性,Cam Shift由此應運而生,它可以產生自適應大小的目標box。

我們假設在連續兩幀中跟蹤目標的大小和位置都不相同。第一幀的目標box的大小和位置已知,我們可以根據Mean Shift計算出第二幀中目標box的位置。這裏我們採用大小相同的目標box,而是使用第一幀中大小和位置的信息計算一個二階矩,由於不變矩的存在,利用第一幀的二階矩和第二幀中的位置信息可以推算出第二幀中目標box的大小信息。

5、均值漂移——總結

優點:算法複雜度小;是無參數算法,易於與其它算法集成;採用加權直方圖建模,對目標小角度旋轉、輕微變形和部分遮擋不敏感等。

缺點:目標的運動不能過快。

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章