【深度學習-圖像識別】基於GhostNet進行ImageNet上1000類別的圖像識別

原創

2020-06-29 02:27

GhostNet: MoreFeaturesfromCheapOperations

（一）論文地址：

https://arxiv.org/abs/1911.11907

檢測效果：

運行demo.py

（需要代碼和模型權重的請私戳我哦，聯繫方式見文章末）

（二）核心思想：

作者爲了進一步壓縮 CNN 網絡結構，提出了一個 Ghost module，其核心是通過簡單的線性變換，在內在特徵圖的基礎上，生成更多可以完全揭示內在特徵信息的幽靈👻特徵圖（ghost feature map），從而以較小的計算代價生成更多特徵；

作者提出的 Ghost module 可以看作一個即插即用組件，用於升級現有的卷積神經網絡，其核心是在輸出通道數不變的情況下，減小卷積層的通道數並採用一個線性變換來升維，以此減小參數；

同時作者也提出了一個 Ghost Bottleneck 模塊用來堆疊 Ghost module，並以此構建了一個新的網絡 GhostNet，實現了 75.7% top-1 準確率，在比 MobileNetV3 準確率還高的基礎上，進一步壓縮了模型；

（三）特徵冗餘：

在訓練好的深度神經網絡的特徵圖中，豐富甚至冗餘的信息常常保證了對輸入數據的全面理解；

例如 ResNet-50，如果把特徵圖可視化，可以看到有許多相似甚至相同的特徵圖，就像彼此的幽靈一樣；

作者認爲這些相似的特徵圖並非冗餘的，而是對檢測和識別非常重要的，因此作者並沒有去想辦法去除這種冗餘，而是採取了一種更爲節省計算消耗的方式去生成這些幽靈特徵圖，由此搭建的網絡就稱之爲——GhostNet；

（四）傳統卷積的問題：

現在通用的一個減小卷積層參數的方法是 MobileNet 提出的深度分離卷積：

雖然深度分離卷積大大減小了參數量，但是隨後用來升維或者降維並融合特徵的 1×1 卷積仍然佔用了客觀的計算消耗和內存，生成的幽靈特徵圖也證明它有很大的改進空間；

針對這個問題，作者提出了可以減小卷積層使用的卷積核數目：

假設輸入爲 $X\in R^{c×h×w}$ ，其中 $c$ 爲通道數， $h,w$ 分別爲特徵圖的高度和寬度；

那麼任意卷積層生成 $n$ 個 feature map 的操作就可以表示爲：

$Y=X*f+b$

其中 $*$ 是卷積操作， $b$ 是偏置， $Y\in R^{h^{'}×w^{'}×n}$ 是輸出的特徵層， $f\in R^{c×k×k×n}$ 是卷積核，那麼計算消耗 FLOPs 就是：

$n × h^{'}· w^{'}·× c × k × k$

然而對於通常情況下 $n,c=256,512$ ，計算消耗會非常大；

作者提出，可以通過控制卷積核中 $n$ 的大小來減小計算量，並通過一個簡單的線性變換起到升維的作用；

（五）Ghost Module for More Features

這裏作者簡介了 Ghost Module，可以將其作爲替換卷積層的模塊；

此時設置一箇中間量 $Y^{'}\in R^{h^{'}×w^{'}×m}$ ，其中 $m<n$ ；

這時： $Y^{'}=X*f^{'}$

其中偏執 $b$ 被去掉，其他的超參數（如步長、卷積核大小）等保持不變；

此時再將 $Y^{'}$ 中的 $m$ 個特徵圖分離，對每個特徵圖分別進行一次線性變換，使每個特徵圖生成 $s$ 個幽靈特徵圖，用公式表示爲：

$y_{i,j}=\Phi_{i,j}(y^{'}_i),\forall i=1,…,m, j=1,…,s$

其中 $y^{'}_i$ 是 $Y^{'}$ 的第 $i$ 個特徵圖， $\Phi_{i,j}$ 是生成第 $j$ 個幽靈特徵圖 $y_{i,j}$ 的線性操作；

這樣我們就得到了通道數爲 $n=m*s$ 的特徵層 $Y$ ；

（六）Ghost bottleneck：

作者提出了兩種 Ghost Module 的堆疊結構，主要是用來替換 ResNet 中的殘差結構；

網絡的整體結構如圖：

SE 表示是否使用 SE 模塊；

（七）實驗結果：

聯繫我們：

權重文件需要的請私戳作者~

（長期接私活~）

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

【深度學習-圖像識別】基於GhostNet進行ImageNet上1000類別的圖像識別

GhostNet: MoreFeaturesfromCheapOperations

（一）論文地址：

（二）核心思想：

（三）特徵冗餘：

（四）傳統卷積的問題：

（五）Ghost Module for More Features

（六）Ghost bottleneck：

（七）實驗結果：

聯繫我們：

詐騙（殺豬盤）網站進行滲透測試

Python 潮流週刊#50：我最喜歡的 Python 3.13 新特性！

【Python】保存gym截圖

【譯】使用 GitHub Copilot 作爲你的編碼 GPS

Linux 服務器配置-安裝portainer-ce社區版

外行也能讀懂的網絡硬件設備功能原理速成

【數據集合集】最全最新——智能交通和無人駕駛相關數據集

【深度學習-圖像識別】腦PET圖像分析和疾病預測Baseline

【深度學習-語音分類】嬰兒啼哭聲識別挑戰賽Baseline

【論文閱讀筆記】Recursive Unsupervised Learning of Finite Mixture Models

【基於深度學習的腦電圖識別】手把手教你使用 1D 卷積和 LSTM 混合模型做 EEG 信號識別

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結