1. 論文基本信息
- 論文標題:Discriminative Correlation Filter with Channel and Spatial Reliability
- 作者:Alan Lukezic等
- 出處:CVPR,2017
- 文章鏈接:https://arxiv.org/abs/1611.08461
- 補充材料:https://www.semanticscholar.org/paper/Discriminative-Correlation-Filter-with-Channel-and-Luke%C5%BEi%C4%8D-Voj%C4%B1-%C5%99/7b485979c75b46d8c194868c0e70890f4a0f0ede
- 源碼鏈接:https://github.com/alanlukezic/csr-dcf
這篇筆記主要針對分割操作進行分析和理解,關於論文其他部分創新點及其整體思路會在後續文章中進行分析。
2. 似然和後驗概率在論文中的作用
目前基於相關濾波的跟蹤算法,主要存在三個方面的問題:
- 當前的相關濾波算法,由於FFT,導致濾波器尺寸與圖像塊尺寸必須一致,這樣就限制了檢測範圍
- 當前的相關濾波算法,由於引入了循環矩陣,導致濾波器的訓練數據並不真實
- 當前的相關濾波算法,只能支持矩形目標,與真實世界不符合
作者爲解決上述問題,提出的創新點之一就是“空間置信”(Spatial Reliability),其主要思想是利用圖像分割方法產生適應能力更好的蒙版(mask),這個空間置信圖就是通過下面後驗概率的求解得到的。
3. 具體建模和操作
文章這一部分涉及到的概念有:
- 貝葉斯
- Epanechnikov
- foregroundLikelihood/backgroundLikelihood
- 反向投影
- 後驗概率
以求解目標的後驗概率爲例,根據論文源代碼,其公式爲
其中, 是先驗概率,它可以認爲是固定的數值,與採樣數據中的前景/背景區域有關,而 相當於似然,可以理解爲“在給定的前景圖像中,該像素屬於目標的概率(疑似目標)”,最後求解的 是後驗概率,可以理解爲“在給定的目標圖像條件下,該像素屬於前景蒙版的概率”
文章在求解上述先驗概率 時,利用Epanechnikov分佈進行了處理(論文使用的不是標準Epanechnikov,有修改,本質上仍然屬於二次函數)
文章在計算似然時,用到了反向投影方法。直觀上理解,就是利用反向投影中的顏色信息,在採樣範圍內捕捉與目標顏色相近的部分,作爲似然(疑似目標),關於反向投影的知識,可以參考:
- http://blog.csdn.net/sevencolorfish/article/details/6840719
- http://docs.opencv.org/2.4/doc/tutorials/imgproc/histograms/back_projection/back_projection.html
根據貝葉斯後驗概率公式,在已知先驗概率和似然的前提下,可以求出後驗概率,因此能夠得出最終需要的蒙版的概率圖(也就是論文中的spatial reliability map)。
與文章中的公式進行對照,發現吻合,相同的顏色表示同一類物理量,如下:
附上論文的示意圖,一併對照
4. 小結
從物理意義上分析,這種思路可以粗略理解爲用先驗概率圖與似然概率圖進行的某種圖像卷積而形成的濾波過程,最終實現了對不規則形狀的物體的自適應,這種創新思路值得我們學習。關於濾波器優化的推導過程(Lagrange方法),見論文筆記2:http://blog.csdn.net/discoverer100/article/details/78323934
更多內容,請掃碼關注“視覺邊疆”微信訂閱號