【論文筆記-Stereo】ICCV2017 Cascade Residual Learning: Stereo Matching

這篇文章介紹了一種新的雙目視差計算框架,Cascade Residual Learning。

近年來,在MC-CNN的啓發下,視差計算算法成爲了一種可以用學習解決的問題。文章總結了近年來基於CNN的視差算法,主要可以分爲一下三種:
1. Matching cost Learning:這種方法主要將CNN用於匹配代價計算,輔之以一些經典的後處理方法,以得到比較好的視差圖。主要代表有:

  • Han et al.的MatchNet:提出了Siamese 結構
  • Zbontar的MC-CNN:提出將CNN用於提取patch特徵用於計算patch simularity,同時,他們將視差計算問題當做一個二分類問題,採取正負樣本抽樣、使用hinge loss 訓練cost 計算網絡
  • Luo 等人將該問題變換爲一個概率分佈學習問題

這些方法都取得了非常不錯的效果,可是他們都需要對生成的視差圖比較繁雜的後處理,才能得到最後的結果。
2. Regularity Learning
3. End-to-end disparity learning: 通過細心的設計網絡的結構,我們可以通過端到端的方式直接學習得到精細的視差圖。這種框架的主要代表有:

  • Mayer等人提出的DispNet,這種方法被用來學習合成的雙目圖像對。該方法還被用於光流計算,FlowNet 2.0便由此而來。
  • GC-Net用3D卷積網絡學習上下文信息,以計算視差圖
  • 在單目視差估計領域,監督的非監督的方法都實現了端到端的視差生成,並且,他們只需要少量的訓練樣本。
  • CVPR 2017, 有人提出將CNN+CRF混合模型,也實現了雙目視差的end-to-end計算。

論文中的算法屬於第三種,

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章