作者 | autocyz

來源 | https://zhuanlan.zhihu.com/p/54425450

原文 | http://bbs.cvmart.net/articles/301

從MobileNet中的深度可分卷積（Depthwise Separable Convolution）講起

看過MobileNet的都知道，MobileNet最主要的加速就是因爲深度可分卷積（Depthwise Separable Convolution）的使用。將原本一步到位的卷積操作，分爲兩個卷積的級聯，分成的兩個卷積相對於原始的卷積而言，參數大大減少，計算量大大減少。

1、標準卷積：

2、深度可分卷積：

深度可分卷積是將原來的一個卷積，分解成兩個不同的卷積，每個卷積的功能不一樣。一個在feature map進行卷積，一個在通道上進行卷積。

3、深度可分卷積的pytorch實現：

def conv_dw(inp, oup, stride):
    return nn.Sequential(
        nn.Conv2d(inp, inp, 3, stride, 1, groups=inp, bias=False),
        nn.BatchNorm2d(inp),
        nn.ReLU(inplace=True),

        nn.Conv2d(inp, oup, 1, 1, 0, bias=False),
        nn.BatchNorm2d(oup),
        nn.ReLU(inplace=True)        
    )

將訓練好的卷積模型轉換爲深度可分卷積

既然有了深度可分卷積，並且這個卷積方法可以在不改變特徵輸入輸出大小的基礎上極大減少參數量和計算量，那麼我們當然會想着把已有模型中的標準卷積換成深度可分卷積。可是，在替換成深度可分卷積時，實際上模型由原來的一個卷積變成了兩個卷積，模型結構已經發生了變化，所以我們需要對轉換後的深度可分卷積模型重新訓練。這就要求我們有足夠的數據，足夠的時間重新訓練。

有沒有什麼方法能夠不重新訓練模型，直接將已有的訓練好的模型，轉換成深度可分卷積呢？

答案是：有！

接下來要講的方法就是出自文章：https://arxiv.org/abs/1812.08374?context=cs

文章流程圖：

文章思想：

文章思想很簡單，通過使用作者提出的DAC方法，直接將一個標準卷積的權植，分解成兩個卷積的級聯。

MobileNet中可分離卷積的區別：

乍一看這種分解出來的結果和可分離卷積形式一樣，實則不然，具體區別有兩點：

MobileNet的深度可分卷積在depthwise和pointwise之間有BN和激活層，而DAC分解的則沒有。
MobileNet的深度可分卷積在depthwise階段，每個輸入channel，只對應一個卷積核，即depthwise階段卷積核的大小爲
，而DAC中每個輸入channel對應了 r 個卷積和，所以此階段總的卷積核大小爲
同理，在pointwise階段，兩種方法的卷積核大小也不一樣。

具體方法：

作者在文章中給出了非常清晰的算法流程，中間用到了SVD分解的方法獲取主成分。具體方法如下：

計算量的減少：

實驗分析：

作者做了兩個探究性實驗，探究了分解哪些層對模型的影響最大，並且在物體分類、物體檢測、pose estimation上都做了遷移測試。這裏講一下兩個有意思的探究性實驗，其他遷移實驗可以去文章細看。

實驗一：驗證分解單個層並且使用不同的rank（即上面說的分解因子 r ）對模型整體性能的影響。

作者對CIFAR-VGG模型的不同卷積層進行DAC分解，每次只分解一個卷積層，得到如下結果：

結論：

1、使用較小的rank，比如rank=1時，分解前面的層（例如conv2d_1）會導致模型精度損失特別厲害（93.6->18.6），而分解後面的層（conv2d_13）則不會損失很多（93.6->92.9）.
2、越大的rank，精度損失的越小。比如在conv2d_1階段，rank5 的精度遠遠高於rank1.

實驗二：驗證分解前k個層和後k個層對模型精度的影響

前k個層就是從第一個到第k個，後k就是從最後一個到導數第k個

結論：同等條件下（相同的rank），分解網絡後面的層產生的精度損失會小於分解網絡前面的層。

總結

方法非常簡單使用，而且又很容易遷移到各種模型上去。最最主要的是，直接對訓練好的model進行分解，不必再重新訓練了。省時又省力，美滋滋。

[1] Howard A G, Zhu M, Chen B, et al. Mobilenets: Efficient convolutional neural networks for mobile vision applications[J]. arXiv preprint arXiv:1704.04861, 2017.

[2] Li X, Zhang S, Jiang B, et al. DAC: Data-free Automatic Acceleration of Convolutional Networks[J]. arXiv preprint arXiv:1812.08374, 2018.

不用重新訓練，直接將現有模型轉換爲 MobileNet

從MobileNet中的深度可分卷積（Depthwise Separable Convolution）講起

1、標準卷積：

2、深度可分卷積：

3、深度可分卷積的pytorch實現：

將訓練好的卷積模型轉換爲深度可分卷積

總結

容器中nginx無法使用同一個網絡下的容器域名

NETCore中實現一個輕量無負擔的極簡任務調度ScheduleTask

docker使用特定的網絡

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

nodejs學習07——API

避免DbContext同時在多個線程調用

Python: SunMoonTimeCalculator

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

free AI online tools All In One

C# Xmlserializer 程序集內存泄露

Darknet Fine tune模型注意事項

Incremental Learning

IEEE Access投稿（Latex模板）——參考文獻的生成

ICML 2019 | Hinton等人新研究：如何更好地測量神經網絡表示相似性

遷移學習的應用場景以及finetune的使用方法

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結