Learning Deconvolution Network for Segmentic segmentation_ICCV_2015論文筆記

本文作者提出了一個這樣的框架:

  這樣的一個框架作者把他命名爲EDeconveNet,這個框架有兩部分組成一個是 convolution networks 一個是deconvolution network。

  本文提出了FCN在圖像語義分割的時候主要注重物體的整體輪廓,而忽略了細小的特徵,本文正是修正了這一缺點。

  在convolution network中我們提取high-level semantic imformation,由於卷積和pooling層的使用,此時雖然會得到語義信息,但是同時也會損失掉localization imformation,這也是卷積網絡在semantic segmentation中的一個無法避免的地方,所以CNN非常適用與classification而不能直接應用於senmantic segmentation。但是在本文中提出了一個很好的pooling方法,如下圖:

在進行pooling的時候,用一個switch variables進行存儲activations的位置信息這樣在進行unpooling的時候就可以很好的進行還原,localization imformation的缺失降低到最小。

  在decovolution network中主要起的作用就是upsampling。

  在training過程中作者也是用了一些小技巧使網絡能夠在小樣本上訓練,作者在每一層都加了Batch Normalization的過程,訓練分爲兩步:第一步使用一些比較容易的的訓練樣本訓練網絡。比如手工指定proposal的位置,背景不復雜的圖片等,在第二步中,爲了能夠使網絡達到instance-wise的效果,作者使用較難的樣本對網路進行fine-tune。

Ensemble with FCN

將FCN對於能夠很好的獲取整體結構,對於EDeconveNet能夠很好的獲取細節信息,將這兩種方法融合得到了最好效果。

Instance-wise Segmentation:

  把每張圖片截切爲很多子圖片,每張圖片包含一個實例。每張子圖片進行輸入,得到分割結果,再把這些結果聚合起來,得到整張圖片的分個圖

  注:個人理解這裏的子圖片是由於你在convolution network中用不同的kernel對原圖片進行卷積,不同的卷積核會選取不同的圖片上的objects,從而會產生很多子圖片。

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章