1.介紹
MixConv是谷歌大牛Quoc V. Le
的在AutoML
領域的又一力作 ,論文的名字:Mixed Depthwise Convolutional Kernels,通過名字,我們就可以知道該論文的核心所在,混合分離卷積,其實,看到這裏之後,我覺論文就可以粗看一下就行,谷歌很多論文,方法簡單粗暴好用,思想巧妙,容易懂。
2.模型結構
作者提出一種混合深度分離卷積(MDConv),它將不同尺寸卷積核混疊到同一個卷積OP單元中,故而它可以輕易的捕獲不同分辨率的特徵模式,在下圖中,a圖是普通分離卷積,b圖是結合了多個不同尺寸的分離卷積,這個思想和GoogLeNet有點相似,GoogLeNet可以參考我寫的文章:https://blog.csdn.net/u013289254/article/details/95511079
3.代碼實現
def mdconv(x, filters, **args):
G = len(filters)
y = []
for xi, fi in zip(tf.split(x, G, axis=-1), filters):
y.append(tf.nn.depthwise_conv2d(xi, fi, **args))
return tf.concat(y, axis=-1)