Astrous Convolution, Astrous Spatial Pyramid Pooling, Fully Connected Conditional Random Field

翻譯的一篇英文博文,原文地址見文末

Atrous Convolution 原子卷積or空洞卷積?

“Atrous”源自法語“à trous”,意思是洞。一些論文也稱它爲“膨脹卷積“。它通常用於小波變換,現在它被用於深度學習中的卷積。
公式:
在這裏插入圖片描述
當r=1時,它就是我們常用的標準卷積,當r>1時即atrous convolution,r表示卷積過程中對輸入樣例採樣的步長(stride to sample the input sample during convolution)。
思想:
在這裏插入圖片描述
(a) 是標準卷積,(b)是atrous convolution。當rate=2時,輸入信號被交替採樣(sampled alternatively)。首先,pad=2意味着我們在左右兩邊填充2個0。在rate=2的情況下,我們每2個輸入採樣輸入信號進行卷積。因此我們得到5個輸出,這使得輸出的特徵圖變大。
如果我們記得FCN,一系列的卷積和池化使得輸出的特徵圖非常小,而且需要32倍的上採樣,這是一個很激進的上採樣(aggressive upsampling)。
而且,atrous convolution擴大了濾波的視域進而能夠包含更大的上下文。因此,它提供了一種有效的機制控制視野,並且在精確定位(小視野)和上下文同化(大視野)間找到了最佳平衡。
DeepLab使用VGG-16或ResNet-101,最後的池化層(pool5)或卷積(conv5_1)分別被設置爲1以免抽取過多的信號。Rate=2的atrous convolution被用來替代所有後續的卷積層,輸出變得大了很多。我們只需要對輸出進行8倍的上採樣,而雙線性插值對8倍上採樣具有相當好的性能。

Atrous Spatial Pyramid Pooling (ASPP) 多孔空間金字塔池化

在這裏插入圖片描述
ASPP實際上是空間金字塔池化(SPP)的空洞版本,這一概念已被應用到SPPNet中。在ASPP中,具有不同速率(rate)的空洞卷積並行地被應用到輸入特徵圖上並融合在一起。
由於同一類別的對象在圖像中可以有不同的比例,因此空洞空間金字塔池化可以幫助處理不同對象尺度進而提高準確性。

Fully Connected Conditional Random Field 全連接條件隨機域

雙線性插值後,全連接條件隨機域被應用在網絡輸出。
在這裏插入圖片描述
X是像素的標籤分配,p(xi)是像素i的標籤分配概率。因此第一項θi是對數概率。第二項θij是一個濾波器。當xi != xj時µ = 1,當xi = xj時 µ = 0。括號中是兩個內核的加權和。第一個核依賴於像素值的差異和像素位置的差異,這是一種雙邊濾波器,雙邊濾波器具有保邊的特性。第二個核僅依賴於像素的位置差,這是高斯濾波。σ 和w通過交叉驗證得到。
然而條件隨機域是一個後處理過程,這使得DeepLabV1和DeepLabV2不再成爲端到端的學習框架。它已經不被用在DeepLabV3和DeepLabV3+中。

原文地址:
Review: DeepLabv1 & DeepLabv2 — Atrous Convolution (Semantic Segmentation)

相關博文:
論文閱讀理解 - (Deeplab-V3)Rethinking Atrous Convolution for Semantic Image Segmentation
DeepLab V2 論文筆記

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章