CSR-DCF視頻目標跟蹤論文筆記(2)——關於濾波器Learning的推導(Augmented Lagrangian方法)

1. 論文基本信息

這篇筆記主要針對濾波器求解的推導過程進行分析(拉格朗日乘子法),主要參考內容是原文的補充材料,關於論文其他部分創新點及其整體思路會在後續文章中進行分析。(筆記1的鏈接:http://blog.csdn.net/discoverer100/article/details/78182306

2. 濾波器求解目標函數的構建

在多通道情況下,目標函數爲

(1)argminhd=1Nd(fdhdg2+λhd2)=argminhd=1Nd(h^dHdiag(f^d)g^d2+λh^d2)

其中,h 表示濾波器,d=1toNd 表示Nd 個通道,g 表示期望的響應輸出,λ 表示正則項用於防止過擬合(關於正則項爲什麼可以防止過擬合可以參考:http://www.cnblogs.com/alexanderkun/p/6922428.html

根據上述(1)式,爲簡化推導過程,將多通道情況改爲單通道情況模式,則目標函數爲

(2)argminhfhg2+λh2=argminhh^Hdiag(f^)g^2+λh^2

引入變量hc 並定義約束條件
(3)hchm=0

其中,hmmh ,而m 表示論文中的空間置信圖(spatial reliability map),也可以理解爲一個mask,具體概念可以參考前面的一篇文章:http://blog.csdn.net/discoverer100/article/details/78182306,上述(3)式中引入的變量hc 可以先不理會其物理意義,它的主要作用是讓算法能夠收斂(論文原文表述:prohibits a closed-form solution),個人猜測:這裏的下標命名爲c,可能就是取constrained的第一個字母。

對(2)式引入上述約束條件,並進一步調整,得到最終的目標函數

(4)argminhc,hmh^cHdiag(f^)g^2+λ2h^m2s.t.hchm=0

上述的正則項前面多出了一個係數1/2 ,其主要意圖是求導數後係數可以變爲1 ,便於公式書寫。

這樣,公式(4)就是我們推導的起始表達式。

3. 構建Lagrange表達式

根據上述目標函數,以及Augmented Lagrangian方法(參考Distributed optimization and statistical learning via the alternating direction method of multipliers),構建Lagrang表達式,如下

(5)L(h^c,h,I^|m)=h^cHdiag(f^)g^2+λ2hm2+[I^H(h^ch^m)+I^H(h^ch^m)¯]+μh^ch^m2

其中,字母I 表示Lagrange乘數,字母上面的橫槓表示共軛矩陣,字母右上方的H 表示共軛轉置矩陣,因此有規律:A¯T=AH (後面的推導中可能同時存在兩種表示,需要留意)。將上述(5)式進行向量化表示,可得
(6)L(h^c,h,I^|m)=h^cHdiag(f^)g^2+λ2hm2+[I^H(h^cDFMh)+I^H(h^cDFMh)¯]+μh^cDFMh2

不難看出,上述(5)式到(6)式,主要變化就是將變量h^m 的表達式替換爲DFMh ,其中F 表示離散傅里葉變換矩陣,它相當於一個常量,DF 的大小(F 是一個D×D 的方陣),M=diag(m)

將上述(6)式簡單表述爲四個項的和,爲

(7)L(h^c,h,I^)=L1+L2+L3+L4

其中,
(8){L1=h^cHdiag(f^)g^2=(h^cHdiag(f^)g^)(h^cHdiag(f^)g^)¯TL2=λ2hm2L3=I^H(h^cDFMh)+I^H(h^cDFMh)¯L4=μh^cDFMh2=μ(h^cDFMh)(h^cDFMh)¯T

4. 開始優化,首先對h_c求偏導數

對上述公式(4)的優化可以表述爲下面的迭代過程

(9)h^copt=argminhcL(h^c,h,I^)hopt=argminhL(h^copt,h,I^)

現在看關於變量h^c 的優化,需要令滿足h^c¯L0 ,也就是
(10)h^c¯L1+h^c¯L2+h^c¯L3+h^c¯L40

對各個分量求偏導數,有
(11)h^c¯L1=h^c¯[(h^cHdiag(f^)g^)(h^cHdiag(f^)g^)¯T]=h^c¯[h^cHdiag(f^)diag(f^)Hh^ch^cHdiag(f^)g^Hg^diag(f^)Hh^c+g^g^H]=diag(f^)diag(f^)Hh^cdiag(f^)g^H0+0=diag(f^)diag(f^)Hh^cdiag(f^)g^H

(12)h^c¯L2=h^c¯[λ2hm2]=0

(13)h^c¯L3=h^c¯[I^H(h^cDFMh)+I^H(h^cDFMh)¯]=h^c¯[I^Hh^cI^HDFMh+I^Th^c¯I^TDFMh¯]=00+I^T0=I^

(14)h^c¯L4=h^c¯[μ(h^cDFMh)(h^cDFMh)¯T]=h^c¯[μ(h^ch^cHh^cDhHMFHDFMhh^cH+DFMhDhHMFH)]=h^c¯[μ(h^ch^cHh^cDhHMFHDFMhh^cH+DFMhhHMFH)]=μ(h^c0DFMh+0)=μh^cμDFMh

於是,上述公式(10)可以寫成

(15)diag(f^)diag(f^)Hh^cdiag(f^)g^H+0+I^+μ(h^c0DFMh+0)0diag(f^)diag(f^)Hh^cdiag(f^)g^H+I^+μ(h^c0DFMh+0)0

回顧公式(6),我們曾將變量h^m 的表達式替換爲DFMh ,現在我們將它替換回來,得
(16)diag(f^)diag(f^)Hh^cdiag(f^)g^H+I^+μ(h^c0h^m+0)0

針對h^c 合併同類項,得
(17)h^c[diag(f^)diag(f^)H+μ]=μh^m+diag(f^)g^HI^

於是,
(18)h^c=diag(f^)g^H+μh^mI^diag(f^)diag(f^)H+μ

根據對角矩陣的乘法性質以及相關濾波基礎概念,我們可以將上述(18)式的表達進行簡化,得
(19)h^c=f^g^+μh^mI^f^f^+μ

由於右上角得星號表示共軛矩陣,爲與作者原文表述一致,也可用頂部的橫槓表示,有
(20)h^c=f^g^¯+μh^mI^f^f^¯+μ

這樣就完成了對變量h^c 的最優化求解,它對應論文官方源碼中的變量G(位於create_csr_filter.m中)
G = (Sxy + mu*H - L) ./ (Sxx + mu);

5. 對變量h求解偏導數

前面的公式(10)-(20)都是針對變量h^c 求解偏導數,由於論文提出的Lagrange表達式中含有兩個變量,現在還需要針對變量h¯ 求解偏導數,也就是

(21)h¯L1+h¯L2+h¯L3+h¯L40

首先回顧(8)式,也就是L1、L2、L3和L4這四個優化項
(8){L1=h^cHdiag(f^)g^2=(h^cHdiag(f^)g^)(h^cHdiag(f^)g^)¯TL2=λ2hm2L3=I^H(h^cDFMh)+I^H(h^cDFMh)¯L4=μh^cDFMh2=μ(h^cDFMh)(h^cDFMh)¯T

其關於變量h¯ 的偏導數爲
(22)h¯L1=h¯[(h^cHdiag(f^)g^)(h^cHdiag(f^)g^)¯T]=0

(23)h¯L2=h¯[λ2hm2]=h¯[λ2mh2]=h¯[λ2(Mh)¯T(Mh)]=h¯[λ2hHMHMh]

觀察(23)式,由於其中的M 表示論文定義的mask(也就是Spatial reliability map)的對角線元素,這個矩陣中的所有元素僅爲0或者1,它們都是實數,因此(23)式中的MHM 可以簡化表示爲M ,於是,

(24)h¯L2=h¯[λ2hHMh]=h¯[λ2((hHMh)T)T]=h¯[λ2(hTMTh¯)T]=(λ2(hTMT))T=λ2Mh

2018年8月更新:特別注意,上述公式(24)推導過程有誤,應改爲如下(此處特別感謝CSDN網友weixin_41660496):

(24)ch¯L2=h¯[λ2hHMh]=h¯[λ2(h¯)TMh]=λ2Mh

(25)h¯L3=h¯[I^H(h^cDFMh)+I^H(h^cDFMh)¯]=h¯[I^Hh^cI^HDFMh+I^Th^c¯I^TDFMh¯]=00+0I^TDFM¯=DI^TF¯M¯=D(I^)T(FH)T(MH)T=D(MHFHI^)T=D(MFHI^)T

2018年8月更新:特別注意,上述公式(25)推導過程有誤,應改爲如下(此處特別感謝CSDN網友weixin_41660496):

h¯L3=h¯[I^H(h^cDFMh)+I^H(h^cDFMh)¯]=h¯[I^H(h^cDFMh)+I^Hh^c¯I^HDFMh¯]=h¯[I^Hh^cI^HDFMh+I^Th^c¯I^HDFMh¯]=h¯[I^Hh^cI^HDFMh+I^Th^c¯I^HDFMh¯]=h¯[I^Hh^cI^HDFMh+I^Th^c¯I^H¯D¯FMh¯]=h¯[I^Hh^cI^HDFMh+I^Th^c¯I^H¯DFMh¯]=h¯[I^Hh^cI^HDFMh+I^Th^c¯I^H¯DF¯M¯h¯]=00+0(I^H¯D)(F¯M¯)T=00+0(I^H¯D)M¯TF¯T=00+0(I^D)MTFH=DMTFHI^=DMFHI^

上述(25)式中,利用了矩陣D,M 爲實數矩陣的性質,所以有M¯=M , D¯=D ,另外M 也是一個對角矩陣,因此MT=M

最後是L4項

(26)h¯L4=h¯[μ(h^cDFMh)(h^cDFMh)¯T]=h¯[μ(h^ch^cHh^cD(F¯M¯h¯)TDFMhh^cH+DFMh(F¯M¯h¯)T)]=h¯[μ(h^ch^cHh^cDhHMFHDFMhh^cH+DFMhhHMHFH)]=0h¯[μh^cDhHMFH]0+h¯[μDFMhhHMHFH]=[hH[μh^cDhHMFH]]T+[hH[μDFMhhHMHFH]]T=[hH[μDh^chHMFH]]T+[hH[μDFMhhHMHFH]]T=μD[(h^c)T(MFH)T]T+μD[(FMh)T(MHFH)T]T=μD[(MFH)T]T[(h^c)T]T+μD[(MHFH)T]T[(FMh)T]T=μDMFHh^c+μDMHFHFMh=μDMFHh^c+μDMHIMh=μDMFHh^c+μD(MM)h=μDMFHh^c+μDMh

上述(26)式末尾利用了MM=M ,這是因爲M 表示空間置信圖(Spatial reliability map),根據論文中的定義,矩陣M 中的元素要麼爲1,要麼爲0,因此MM=M

將上述(22)-(26)式代入到(21)式中,有

(27)λ2MhDMFHI^μDMFHh^c+μDMh=0

對上式中的Mh 進行合併同類項,有
(28)(λ2+μD)Mh=DMFHI^+μDMFHh^cMh=DMFHI^+μDMFHh^cλ2+μDMh=MDFH(I^+μh^c)λ2+μDMh=MDDFH(I^+μh^c)1D(λ2+μD)Mh=M1DFH(I^+μh^c)λ2D+μ

現在簡單回顧一下傅里葉逆變換的定義
(29)F1(x^)=1DFHx^

據此,可以將上述(28)式表示爲
(30)Mh=MF1(I^+μh^c)λ2D+μdiag(m)h=diag(m)F1(I^+μh^c)λ2D+μmh=mF1(I^+μh^c)λ2D+μ

由於論文中最優化表達式的約束爲mmh (這裏左邊的h 實際上也就是hm ),因此上述(30)式也可以表示爲
(31)h=mF1(I^+μh^c)λ2D+μ

上述(31)式就對應論文原文中的公式(10),相應的代碼位於create_csr_filter.m中的變量H
H = fft2(real((1/(lambda + mu)) * bsxfun(@times, P, ifft2(mu*G + L))));

6. 小結

論文爲求解最優的濾波器值,在原始目標函數的基礎上,引入約束條件,利用Augmented Lagrangian方法構造最優化表達式,最後利用偏導數值爲0的情況進行求解,這種利用拉格朗日最優化方法進行目標跟蹤算法的建模思想值得我們學習,關於(25)式的轉置問題,也歡迎大家共同討論交流。


更多內容,請掃碼關注“視覺邊疆”微信訂閱號

這裏寫圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章