淺析"Sublabel-Accurate Relaxation of Nonconvex Energies" CVPR 2016 Best Paper Honorable Mention

今天作了一個paper reading,感覺論文不錯,馬克一下~

CVPR 2016 Best Paper Honorable Mention "Sublabel-Accurate Relaxation of Nonconvex Energies"


       研究視覺問題的同學都知道,視覺問題很多都是多標籤的問題,在進行優化的時候,我們都可以把他們轉化爲能量函數的形式,由數據項和平滑項組成。這些能量函數可以用變分的形式進行表達,當能量函數的項是非凸的話,一般使用梯度下降迭代的方法進行近似求解,有可能只能得到局部極小值。爲了求解到全局最優值,我們致力於將非凸問題轉化爲凸問題,然後進行優化求解。

       本篇論文基於泛函提升的方法提出空間連續的凸鬆弛框架,即將非凸問題轉化爲凸問題,是一種解決亞標籤精度的多標籤問題的方法。相比以前泛函提升的方法,該論文的方法能夠使用較少的標籤推斷出不錯的結果。這是因爲以前方法標籤之間是線性的,爲了得到一個較好的結果,需要有很多的標籤,而該論文的方法標籤之間是凸近似的,可以是線性的,也可以是二次的。此外,該論文提出的將非凸問題轉化爲凸問題的方法,在數學上是最緊的凸鬆弛,有嚴格的數學推導。

       該論文的整體思路是什麼樣的呢?現在我們有能量函數的變分表達式,分別對兩項求取凸包絡,怎麼求呢?作者使用兩次共軛的方法進行求解,在論文的第三部分有數學推導,這種方法是將非凸問題轉化爲凸問題最緊的方法。然後對轉化後的數學表達式進行優化求解,可以把這個表達式轉化爲一個鞍點形式,進而使用原對偶的方法進行求解。x相比傳統方法,該論文的優勢是使用較少的標籤,能夠推斷出空間平滑的結果,減少標籤的數量,以視差圖爲例,如下:



     爲什麼其標籤少,還能得到不錯的效果呢?請看下圖



    本篇論文的求解方法,作者公佈了代碼,他們還在ECCV2016發表了類似的文章,如下:

Code:https://github.com/tum-vision/sublabel_relax


Sublabel-AccurateRelaxation of Nonconvex Energies (T. Möllenhoff,E. Laude, M. Moeller, J. Lellmann, D. Cremers),In IEEE Conference on Computer Vision and Pattern Recognition (CVPR), 2016.

Sublabel-AccurateConvex Relaxation of Vectorial MultilabelEnergies (E. Laude, T. Möllenhoff, M. Moeller, J. Lellmann,D. Cremers),In European Conference on Computer Vision and Pattern Recognition (ECCV), 2016.









發佈了76 篇原創文章 · 獲贊 226 · 訪問量 88萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章