上採樣(UnSampling)、上池化(UnPooling)、反捲積(Deconvolution)與PixelShuffle(像素重組)之間的區別簡介

    上採樣(UnSampling):即輸入特徵圖,將其縮放到所需大小(比如2*2的寬高--->4*4的寬高),其常用方法是插值方法(如最鄰近插值、雙線性插值和三次插值),其中,最鄰近插值效果最差,放大後的圖像有很嚴重的馬賽克,但速度快;雙線性插值,效果較好,速度也較快,經常被使用;三次插值,效果好,但速度慢。在深度學習中,我們經常是結合雙線性插值和卷積操作來使用的。

 

    上池化(UnPooling):說到上池化操作,就不得不說最大池化操作(MaxPooling),最大池化操作就是選擇池化區域內最大值來傳遞給下一層(這個過程是沒有可學習參數),而上池化就是最大池化的逆過程,最大池化操作是不可逆的(除了最大值被保留),但我們可以記住池化操作中的索引值位置(池化區域內最大值的位置),在上池化的時候,就可以把此層的特徵值放到相應索引值位置並且其它位置直接補0就行。

 

    反捲積(Deconvolution):相比上池化,使用反捲積進行圖像的“上採樣”是可以被學習的(會用到卷積操作,其參數是可學習的)。從下面的動態圖,我們可以知道,卷積核大小是3*3,而特徵圖則被間隔的插入0。但使用反捲積容易產生棋盤效應,詳情可以參考我的一篇博客:反捲積(Deconvolution)與棋盤效應(Checkerboard Artifacts)

     PixelShuffle(像素重組):pixelshuffle的主要功能就是將r*r個通道的特徵圖轉換成新的w∗r,h∗r 的上採樣結果(比如原來特徵圖大小爲4*128*128,現在就調整成大小1*128*128)。具體來說,就是按照一定規則將每個像素點的r*r個通道依次轉換爲對應的r*r的圖像塊。應用場所:在圖像超分辨和圖像增強的算法中需要對特徵圖進行上下采樣的過程,可以解決插值和解卷積的一些人工痕跡問題,當然,也可以解決棋盤效應

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章