【論文筆記】Filter Pruning via Geometric Median for Deep Convolutional Networks Acceleration

原創

2020-06-16 12:00

論文：https://arxiv.org/pdf/1811.00250.pdf
源碼：https://github.com/he-y/filter-pruning-geometric-median

本篇論文來源於CVPR2019的oral，主要提出了一種基於幾何中心剪枝的模型壓縮方法，文章分析了基於範數閾值裁剪的侷限性，提出了FPGM的裁剪方式，並經過實驗驗證證明了FPGM算法更加有效。

簡介

在這篇論文中，指出了基於範數裁剪方式的弊端，經過試驗分析作者發現基於番薯標準裁剪的效果，主要取決於兩個隱含條件： 1）權重的標準差足夠大 2）權重的最小的範數應該趨近於0。然而這兩個條件並不能保證總是滿足，爲了解決這個問題文章提出了一種基於幾何中心的裁剪方式，認爲靠近幾何中心的卷積核在划水，因此可以裁減掉這些冗餘的卷積核。

contributions

1）分析了基於範數標準裁剪方式的侷限性，兩個條件需要被滿足： 1）權重的標準差足夠大 2）權重的最小的範數應該趨近於0
2）提出了幾何中位數裁剪的FPGM方法，裁剪掉可替代的冗餘的卷積核
3）經過試驗證明FPGM真實有效

方法

分析基於範數的評價標準

Figure.2 中藍色的是我們認爲的範數分佈情況，基於範數裁剪的方法在理想情況下能發揮作用，但是在真實環境下卻是綠色的分佈，因此說明傳統的基於範數裁剪的方式具有一定的侷限性。
作者預訓練了一些模型，權重分佈可視化效果圖如下所示。

基於幾何中心的評價標準FPGM

公式(1)爲幾何中心的計算法方式，假設在實數空間內存在n個點 $a^{(i)}$ $i∈[1,n]$ ，目標是求解在實數空間內找到到各個a點歐式距離最小的 $x$ ， $x^*$ 即爲到各點距離和最小的幾何中心

對應到本文問題上，我們當前層中的卷積核就是空間內的a點，因爲用卷積核的符號替代，重新整理的後的幾何中心求解公式即爲公式(2) $x^{GM}$ 就是這些卷積核的幾何中心

找到了幾何中心後，順利成章的我們就要開始找到距離幾何中心最近的卷積核了，不難思考直接遍歷每個卷積核，計算其與 $x^{GM}$ 的歐式距離，然後找到最小的即可。如公式(3)所示

pesudocode

實驗結果

論文中分別在Cifar-10 和 ILSVRC-2012數據集上進行實驗，FPGM因爲考慮到了每個濾波器之間的關係，因此取得了較好的實驗結果。

PS：（靠近幾何中心的卷積核被認爲是冗餘的，這裏存疑，划水的卷積核就應該被裁掉麼？個人觀點，如果卷積核彼此之間相似，那麼在當前層對於該類型的featuremap就會增加，讓模型更容易注意到，這是否說明對於model來說，這種類型的卷積核所關注的特徵比較重要呢？）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【論文筆記】Filter Pruning via Geometric Median for Deep Convolutional Networks Acceleration

簡介

contributions

相關工作

方法

分析基於範數的評價標準

基於幾何中心的評價標準FPGM

pesudocode

實驗結果

使用c#強大的表達式樹實現對象的深克隆之解決循環引用的問題

痞子衡嵌入式：恩智浦i.MX RT1xxx系列MCU啓動那些事（12.A）- uSDHC eMMC啓動時間(RT1170)

GPT-4o 引領人機交互新風向，向量數據庫賽道沸騰了

本地SSL證書過期輸入命令在IIS自動生成

.NET週刊【5月第2期 2024-05-12】

求有向圖的最短路徑python

【強化學習】DDPG(Deep Deterministic Policy Gradient)算法詳解

【機器學習】邏輯迴歸(Logistic Regression)

【深度學習】神經網絡實戰-手寫體識別+圖片驗證

【論文筆記】Filter Pruning via Geometric Median for Deep Convolutional Networks Acceleration

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結