MixConv 神經網絡簡介與代碼實戰

1.介紹

    MixConv是谷歌大牛Quoc V. Le的在AutoML領域的又一力作 ,論文的名字:Mixed Depthwise Convolutional Kernels,通過名字,我們就可以知道該論文的核心所在,混合分離卷積,其實,看到這裏之後,我覺論文就可以粗看一下就行,谷歌很多論文,方法簡單粗暴好用,思想巧妙,容易懂。

 

2.模型結構

    作者提出一種混合深度分離卷積(MDConv),它將不同尺寸卷積核混疊到同一個卷積OP單元中,故而它可以輕易的捕獲不同分辨率的特徵模式,在下圖中,a圖是普通分離卷積,b圖是結合了多個不同尺寸的分離卷積,這個思想和GoogLeNet有點相似,GoogLeNet可以參考我寫的文章:https://blog.csdn.net/u013289254/article/details/95511079

 

3.代碼實現

def mdconv(x, filters, **args):
    G = len(filters)
    y = []
    for xi, fi in zip(tf.split(x, G, axis=-1), filters):
        y.append(tf.nn.depthwise_conv2d(xi, fi, **args))
    return tf.concat(y, axis=-1)

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章