Abstract
CVPR 2015的文章,作者來自芝加哥豐田技術學院。早期的方法大多基於隨機場結構來獲取結構信息,本文考慮不使用這些方法來解決分割問題. 本文的語義分割方法是基於超像素級別的,主要做法就是使用縮放結構來利用不同等級的空間特徵對超像素的類別進行判定,從而達到分割的目的.
Framework
- local zoom
即所求超像素塊 - proximal zoom
超像素塊爲中心半徑爲2的區域 - distant zoom
更大的一個bounding box - global zoom
整張圖片
本文的主要做法就是對於local和proximal使用手工提取特徵,對於distant和global使用conv提取特徵,最終形成一個特徵如下:
然後對這個總的特徵訓練一個分類器,損失函數經過了平衡,如下:
通過對每一個超像素塊進行分類來實現分割
Result
Others
沒有開源