1、FCN詳解
fcn中的上採樣其實就是bilinear filtering,就是數字圖像處理的二維插值。將特徵圖放大,然後用crop層剪去多餘的部分,使其和ground truth有一樣的尺寸以便計算各個像素的預測值。bilinear filtering可以用卷積的形式實現。和前面conv層不同,deconv中卷積核不是隨機的,而是根據放大的尺寸生成了與類別相同數量的球形的矩陣,如果你學過插值就知道我說的是什麼。作者在原文中說過deconv中的核可以保持不變或可被訓練,但是我感覺差別不大
==實反捲積(Deconvolution)可能是一種錯誤的名字,通常應該被成爲transposed conv.==卷積的過程,通常並不是直接進行矩陣的乘法在進行加法,而是對不同通道的矩陣進行重疊劃分加序列化變成一個新的大的矩陣,之後對卷子核也進行類似變換,這樣卷積的過程就變成了矩陣乘法的過程。對矩陣乘法結果進行解序列化,轉化成多個矩陣。transposed cov的過程,其實就是執行類似操作,僅有的一步不同就是在於transposed,需要把卷積核進行轉置(這也就是轉置卷積名字的由來),進行矩陣運算即可。具體可參考caffe中源碼im2col.cpp
3 、關於轉置卷積