《Densely Connected Convolutional Networks》論文閱讀筆記

原創

2020-06-07 01:27

原文代碼： https://github.com/liuzhuang13/DenseNet

pytorch實現 https://github.com/liuzhuang13/DenseNet/tree/master/models

論文動機：在CNN中靠近輸入、輸出的層之間如果包含更短的連接，則CNN訓練時會更高效、更準確；

提出網絡：Dense Convolutional Network(DenseNet)；L層的傳統卷積網絡需要L次連接，而DenseNet需要 $\frac{L(L+1)}{2}$ 次連接；

優點：減輕梯度消失問題；加強特徵傳播；支持特徵重用（feature reuse）；減少參數數量（因爲不需要重新學習冗餘的特徵圖，儘管這個網絡結構是dense connectivity，參數反而大大減少）；

Introduction

ResNets、Hightway Networks、FractalNets, they all share a key characteristic: they create short paths from early layers to later layers.

下圖時DenseNet結構，意義：

To ensure maximum information flow between layers in the network, we connect all layers (with matching feature-map sizes) directly with each other. To preserve the feed-forward nature, each layer obtains additional inputs from all preceding layers and passes on its own feature-maps to all subsequent layers.

傳統的前饋結構可以被看作是具有狀態的算法，這個狀態在層與層之間傳播，每一層接收前面一層傳遞的狀態然後寫到下面一層，它改變了狀態，但也傳遞了需要保存的信息。

本文提出的DenseNet結構可以準確區分增加到網絡上的信息以及被保存下的信息；同時Dense connections有正則化作用，會在小訓練集的任務上減少過擬合的影響；

DenseNets

$l{\color{Red} }$ : 層的索引；

$H_{l}(.)$ : 非線性轉換，是一個複合操作，比如BN、ReLU、Poolingu哦這Conv；

$X_{l}$ : $l_{th}$ 層的輸出；

------------------------------------

先回憶ResNets:

$X_{l}=H_{l}(X_{l-1})+X_{l-1}$

優點：梯度可以從後面的層通過恆等函數到達前面的層；

缺點：因爲採用加和的方式將恆等函數和 $H_{l}$ 結合，可能阻礙信息在網絡中的傳播；

------------------------------------

Dense connectivity:

$X_{l}=H_{l}([X_{0},X_{1},...,X_{l-1}]])$

------------------------------------

考慮到特徵圖尺寸可能由下采樣引起的變化，我們將網絡分成多個dense blocks，如下圖；

transition layers: 是block和block之間的，卷積和池化操作；

Growth rate:

每個函數 $H_{l}$ 產生個特徵圖，則 $l_{th}$ 層有 $k_{0}+k*(l-1)$ 個輸入特徵圖， $k_{0}$ 是輸入層的通道數；就是網絡的Growth rate；

------------------------------------

Bottleneck layers:

1X1的卷積在3X3的卷積前作爲一個bottleneck layer，可以提高計算效率；

------------------------------------

Compression:

爲了進一步提高模型的compactness，我們可以減少過渡層的特徵圖的數量。

相關參考 https://blog.csdn.net/u012938704/article/details/53468483

https://blog.csdn.net/u011974639/article/details/78290448

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

論文筆記之Fully Convolutional Networks for Semantic Segmentation

最近了解到了Image Semantic Segmentation方面的知識，在此做一個記錄。這篇論文是2015cvpr的best paper，可以說是在cnn上做圖像語義分割的開山之作。 1.語義分割定義：語義就是指物體的

2020-07-08 10:23:34

MNIST數據集手寫數字識別

pytorch的MNIST數據集手寫數字識別(GPU) 數據集介紹 MNIST 包括6萬張28x28的訓練樣本，1萬張測試樣本，很多教程都會對它”下手”幾乎成爲一個 “典範”，可以說它就是計算機視覺裏面的Hello World。所

2020-07-08 05:29:48

【論文筆記】Convolutional Neural Networks for Sentence Classification

paper鏈接 https://arxiv.org/abs/1408.5882 閱讀這篇paper的一些筆記： Abstract 本文將CNN和NLP結合；介紹了一系列的對比實驗，實驗結果說明了：一個簡單的（單層神經網絡

2020-07-06 18:40:30

卷積神經網絡-BN、Dropout、leaky_relu (tensorflow)

神經網絡是一種比較難以理解的結構，關於神經網絡的各種層次的說明解釋，大家請移步百度、google 本次的分享會從人類視覺角度、生物角度談一談神經網絡中的一些優化算法。首先，計算機領域設計出來的算法、模型和數據結構，都可以理解爲一種建

罗小丰同学

2020-07-04 03:54:05

tensorflow & keras

文章目錄Mnist模型定義keras層優化算法及損失函數文字識別模型檢驗CNNFilterpoolingexampleimportload data設定神經網絡設定優化方法及損失函數訓練RNNLSTM影評分析importload預

2020-07-03 18:57:10

控制邊框邊界溢出代碼與NMS代碼

def _load_pascal_annotation(self, index): #Load image and bounding boxes info from XML file in the PASCAL VOC

2020-07-01 14:04:44

動手記錄模型:mobilenetv1

輕量級網絡:mobilenetv1 神經網絡在實際應用的問題可解釋性差(黑盒子) 沒法微調(百分之99%，剩餘的百分之1%沒法更改) 內存和CPU使用較高解決內存CPU高二值化網絡(Binary) 輕量級網絡 Mo

2020-07-01 09:04:53

從LeNet到EfficientNet：CNN的演變和特點總結

這是一個瞭解CNN主流變化和特點的旅程。卷積神經網絡：構建基塊卷積神經網絡（或簡稱CNN）是提取“可學習特徵”的常用方法。 CNN在深度學習和神經網絡的發展與普及中發揮了重要作用。但是，這篇博客中，我將重點放在完

2020-06-29 07:08:25

四大卷積網絡發家之路

原文鏈接 > AlexNet VGGNet Google Inception Net ResNet 這4種網絡依照出現的先後順序排列，深度和複雜度也依次遞進。它們分別獲得了ILSVRC（I

2020-06-28 06:52:02

論文筆記：Is object localization for free?

Is object localization for free? Weakly-supervised learning with convolutional neural networks 摘要提出一個弱監督卷積神經網絡for

2020-06-28 06:52:02

論文筆記：Look and Think Twice

Look and Think Twice: Capturing Top-Down Visual Attention with Feedback Convolutional Neural Networks 摘要在計算機

2020-06-28 06:52:02

論文筆記：A Global Covariance Descriptor for Nuclear Atypia Scoring in Breast Histopathology Images

Author: Adnan Mujahid Khan 論文原文鏈接：點擊此處摘要細胞核非典型評分通常被用於評定不同癌症的腫瘤等級，包括乳腺癌。本文提出了一個新穎的圖片等級描述器，這個方法是基於區域協方差描述器。我們稱我們的

2020-06-28 06:52:02

搭建CNN識別你的貓貓狗狗

本文爲Udacity優達學城深度學習課程筆記第三篇，使用圖像增強對貓狗圖像進行分類。課程地址：https://classroom.udacity.com/courses/ud187 最終目的是訓練CNN模型，使其能識別上面的小

光于前裕于后

2020-06-25 06:24:00

tf2實現cnn文本分類

哈哈哈　哈哈哈真是讓人喜（feng)歡(diao)的tf2api　哈哈哈哈

光英的记忆

2020-06-24 11:56:20

CNN的重點整理

1.常用的非線性激活函數: sigmoid、tanh、relu等等，前兩者sigmoid/tanh比較常見於全鏈接層，後者relu常見於卷積層。這裏先簡要介紹下最基礎的sigmoid函數（btw，在本博客中SVM那篇文章開頭有提過）

2020-06-24 09:40:00

24小時熱門文章

最新文章

最新評論文章