論文評述：Learning Deconvolution Network for Semantic Segmentation

原創

2018-09-01 20:30

   2:30 - 4:45

  這篇文章是 利用 deconv net 進行 semantic segmentation的先作，在之前ZF曾利用deconv net 做 neural network的可視化工作，它相當於 conv net 的mirror。

 作者利用的是VGG16，應該是fine-trunning 其所有層的參數。（文中沒有提到，所以是猜測）。

 訓練過程分爲兩個階段，第一個階段：根據ground truth 進行 central box 選擇單個instance（中心 tight box 的max side 的1.2x），對這個square box 進行crop。因爲VGG16的

 後兩層fc被保留，所以網絡應該是fixed input，因此，上面的square box 應該進行縮放到原圖大小，再輸入網絡。這一步主要是instance-wise segmentation training。

  第二個階段： 先利用 edge box 方法進行proposal，然後將整張圖片輸入進網絡，進行訓練；注意：要平衡兩步的訓練樣例個數。


  interface階段： 整個網絡的output，即deconv-net 的output應該是多通道的，個數爲C,每一個channel記錄了與原圖大小相同的對應位置的概率（前景、背景的概率），然後選擇概率最大的channel作爲mask,或者將各個channel summation。最後將前面的概率和CRF結合，輸出 pixel-wise labeling。

  網絡架構圖如下：

  可以看到網絡的層數較多，幾乎兩倍的VGG16,訓練時用了BN,和前面的兩階段訓練方法。deconv net的主要目的是memory conv net 的pooling switch variables。

     網絡是和FCN互補的,即克服FCN的對於太大太小區域效果不好的缺點，於是結合FCN對coarse feature的提取，對object shape semantic 有較好的正確率，結合兩者的優點，可產生最佳的效果。

   如下圖：

  另外，對deconv net 的分析：

  可以看到，沒經過一層 deconvolution net （圖b d f h j）能夠rich feature，沒經過一層 uppooling net，能夠sparse feature。噪聲被抑制，和類別相關的信息被放大。高層的deconv layer 能夠捕獲 class-specific shape infomation。

  論文：Learning Deconvolution Network for Semantic Segmentation

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

論文評述：Learning Deconvolution Network for Semantic Segmentation

釘釘打卡速度慢

Nginx R31 doc 官方文檔-01-nginx 如何安裝

Qt/C++音視頻開發74-合併標籤圖形/生成yolo運算結果圖形/文字和圖形合併成一個/水印濾鏡

挑戰程序設計競賽 2.2章習題 POJ - 3617 Best Cow Line 貪心

字節面試：MySQL什麼時候鎖表？如何防止鎖表？

.NET8連接SQL SERVER 2008 R2 報：證書鏈是由不受信任的頒發機構頒發的

golang開發環境搭建(win10)

python計算機視覺學習筆記——PIL庫的用法

Golang初學：獲取程序內存使用情況，std runtime

Latex 引用、索引不跳轉的問題

串聯的圓：有趣的心形線

幾種MAPE的實現方式

TensorFlow 和 Pytorch 中交叉熵 Cross Entropy Loss 的代碼實現和手動實現方式

機器學習之優化算法（二）之梯度下降及收斂性分析

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結