fcn語義分割 論文

全卷積網絡:

個人認爲本文主要是兩個重點:

第一是fcn,全卷積網絡(+上採樣)

第二是skip net

首先說全卷積網絡:

通常cnn在卷積層後會接上若干全連接層,但是全連接層和卷積層的連接數量是固定的,這也就導致了輸入必須是固定的尺寸。如下圖所示:

clipboard

但是在fcn中將fc用卷積取代,再加上採樣層,這樣能夠輸入任何大小的圖片,同時輸出圖片相應大小的語義分割。如下圖所示:

clipboard

可以看到兩站圖中的紅色部分略有不同,這是因爲第一幅圖中通過全連接層,已經破壞了卷積層輸出feature map的空間結構,而第二幅圖中通過全卷積網絡保持了feature map空間結構,在通過反捲積完全可以恢復原圖像中目標的空間位置,也成爲heat map。從下圖中可以看出heat map中的標記與原圖中cat的位置相似。

clipboard

那作者是如何將fc層替換爲全連接層呢?這就樣引出卷積層和全連接層可以相互轉化的關係了。

卷積--------》全連接 :全連接矩陣是一個非常巨大的矩陣,很明顯,全連接層的連接數量要遠遠多於卷積層,所以就可以通過將某些連接置0,使其模擬卷積。

全連接-------》卷積:例如將100x100x1的feature map通過全連接輸出1000大小的一維向量,就可以將每一個輸出看做一個卷積的結果,而卷積的核大小爲100x100。

將fc都用conv替換後,接下來就是上採樣(很多博客稱爲反捲積,但是爲了區別可視化中的反捲積還是稱爲上採樣了好了)。引用一張cs231n中的ppt,

clipboard

通過輸入設置卷積的權重,然後在輸出中相加。類似於插值的思想。(ps:既然如此那能夠使用反捲積網絡搭建一個可學習的插值器,理論上這比採用人工設計的插值要好很多,不知道現在有沒有人做)。

當然整個卷積網絡是可以使用反向傳播的。

其次是skip net:

雖然作者在文中也並不是那麼重點地講,但是這種思想還是可以學習的。如下圖:

clipboard

在卷積網絡(包括卷積、池化)中,層數越深,感受野越大,學習到的特徵就越概括,作者稱之爲coarse(粗糙)。fcn-32s從pooling5上採樣,而結果也顯示細節處理很不好。如下圖:

clipboard

作者通過將低層和高層進行連接,最終可以將低層的圖像細節加到粗糙的輪廓中,如上圖。具體怎樣連接的可以看圖。

當見過skip net這種結構的時候,再見到下圖的結構也就不懵逼了。

clipboard

https://lmb.informatik.uni-freiburg.de/people/ronneber/u-net/

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章