CNN基本結構和經典網絡

原創

2019-03-18 18:18

卷積網絡的基本結構

數據輸入層/ Input layer

3種常見的圖像數據處理方式：一般CNN只用去均值

卷積計算層/ CONV layer

基本概念：

depth:與神經元（filter）個數相等
stribe
zero-padding

卷積寬長深度計算：

$W_{2}=(W_{1}-F+2P)/S+1$

$H_{2}=(H_{1}-F+2P)/S+1$

激勵層(ReLU)

 Sigmoid
 Tanh(雙曲正切)
 ReLU
 Leaky ReLU
 ELU

 Maxout

池化層 / Pooling layer

 夾在連續的卷積層中間
 壓縮數據和參數的量，減小過擬合

池化之後的寬高計算如下：（eg：一個2*2，S=2，池化之後剛好是原來圖像的一半

$W_{2}=(W_{1}-F)/S+1$

$H_{2}=(H_{1}-F)/S+1$

典型CNN結構

LeNet

AlexNet

分了兩組：8層結構（5卷積層+3全連接）跟LeNet相比深度加深，每層神經元數減少

ZF Net

可以理解爲對AlexNet進行了微調。

VGGNet

VGG-16有16個卷積層或全連接層，包括五組卷積層和3個全連接層，即：16=2+2+3+3+3+3。

1、輸入224x224x3的圖片，經64個3x3的卷積核作兩次卷積+ReLU，卷積後的尺寸變爲224x224x64

2、作max pooling（最大化池化），池化單元尺寸爲2x2（效果爲圖像尺寸減半），池化後的尺寸變爲112x112x64

3、經128個3x3的卷積核作兩次卷積+ReLU，尺寸變爲112x112x128

4、作2x2的max pooling池化，尺寸變爲56x56x128

5、經256個3x3的卷積核作三次卷積+ReLU，尺寸變爲56x56x256

6、作2x2的max pooling池化，尺寸變爲28x28x256

7、經512個3x3的卷積核作三次卷積+ReLU，尺寸變爲28x28x512

8、作2x2的max pooling池化，尺寸變爲14x14x512

9、經512個3x3的卷積核作三次卷積+ReLU，尺寸變爲14x14x512

10、作2x2的max pooling池化，尺寸變爲7x7x512

11、與兩層1x1x4096，一層1x1x1000進行全連接+ReLU（共三層）

12、通過softmax輸出1000個預測結果

注意內存的計算

GoogLeNet

去掉了全連接層

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

淺析CNN卷積神經網絡feature map

個人學習CNN的一些筆記，比較基礎，整合了其他博客的內容 feature map的理解在cnn的每個卷積層，數據都是以三維形式存在的。你可以把它看成許多個二維圖片疊在一起（像豆腐皮豎直的貼成豆腐塊一樣），其中每一個稱爲一個

2020-07-07 11:11:21

論文筆記之Fully Convolutional Networks for Semantic Segmentation

最近了解到了Image Semantic Segmentation方面的知識，在此做一個記錄。這篇論文是2015cvpr的best paper，可以說是在cnn上做圖像語義分割的開山之作。 1.語義分割定義：語義就是指物體的

2020-07-08 10:23:34

2018.8.8 kaggle 圖像分類項目

1.今天接到一個電話面試，上來就問我怎麼檢查單鏈表有環。思路：如果一個單鏈表中有環，用一個指針去遍歷，永遠不會結束，所以可以用兩個指針，一個指針一次走一步，另一個指針一次走兩步，如果存在環，則這兩個指針會在環內相遇，時間

2020-07-08 05:52:34

MNIST數據集手寫數字識別

pytorch的MNIST數據集手寫數字識別(GPU) 數據集介紹 MNIST 包括6萬張28x28的訓練樣本，1萬張測試樣本，很多教程都會對它”下手”幾乎成爲一個 “典範”，可以說它就是計算機視覺裏面的Hello World。所

2020-07-08 05:29:48

基於時空圖卷積模型的分析歸納

名稱 ST-GCN 目的解決基於人體骨架關鍵點的人類動作識別問題優點 1、空間關係利用人類關節空間關係理解人類行爲2、層次性ST-GCN 的層次性消除了手動劃分部分或遍歷規則的需要。這不僅能獲得更強的表達能力

2020-07-07 11:11:22

圖卷積-動作識別-姿態預測三篇論文歸納

名稱 Actional-Structural Graph Convolutional Networks forSkeleton-based Action Recognition Convolutional Neural Ne

2020-07-07 11:11:21

TensorFlow學習筆記（二）深層神經網絡與優化算法

三、深度學習與深層神經網絡 1、介紹深度學習特性：多層和非線性線性模型侷限性：只通過線性變換，任意層的全連接神經網絡和單層神經網絡模型的表達能力沒有任何區別。線性模型能夠解決的問題是有限的——這是它的

2020-07-07 11:11:19

【論文筆記】Convolutional Neural Networks for Sentence Classification

paper鏈接 https://arxiv.org/abs/1408.5882 閱讀這篇paper的一些筆記： Abstract 本文將CNN和NLP結合；介紹了一系列的對比實驗，實驗結果說明了：一個簡單的（單層神經網絡

2020-07-06 18:40:30

圖像風格遷移——《A Neural Algorithm of Artistic Style》

之前看到別人玩圖像風格遷移，感覺挺有意思的，趁着空下來的時間自己玩了一下。還是沿着老方法，先看一下論文，然後跑跑程序。論文看的是最基礎的《A Neural Algorithm of Artistic Style》，程序嘛，當然不是笨妞自己

2020-07-05 15:00:45

基於全卷積的圖像語義分割—《Fully Convolutional Networks for Semantic Segmentation》

兩年前，我曾想做一個自動摳“人”的系統，目標是去除路人甲或者自動合成照片。當時“井底之蛙”般搞了一個混合高斯模型，通過像素聚類的方式來摳“人”。這個模型，每跑一張小圖片需要幾分鐘，摳出來的前景“噪音”很嚴重，完全沒辦法使用。最後這個通過“

2020-07-05 15:00:45

Deep dream——《Going Deeper into Neural Networks》

deep dream的體驗和以往看論文，跑例子的過程完全不同。這是在跑“風格遷移”的例子時，在keras的examples中無意看到了程序，然後順帶跑一跑的。跑出來的效果讓我覺得和無厘頭，於是讀程序，看它到底幹了些啥。程序風格也很特別，沒

2020-07-05 15:00:45

卷積神經網絡-BN、Dropout、leaky_relu (tensorflow)

神經網絡是一種比較難以理解的結構，關於神經網絡的各種層次的說明解釋，大家請移步百度、google 本次的分享會從人類視覺角度、生物角度談一談神經網絡中的一些優化算法。首先，計算機領域設計出來的算法、模型和數據結構，都可以理解爲一種建

罗小丰同学

2020-07-04 03:54:05

ImageDataGenerator生成器的flow，flow_from_directory用法總結，及自己踩的坑【原創】

踩坑：一直都不知其問題出在哪，如報錯： ValueError: Error when checking target: expected sequential_1 to have shape (2,) but got array wit

2020-07-04 02:49:22

tensorflow & keras

文章目錄Mnist模型定義keras層優化算法及損失函數文字識別模型檢驗CNNFilterpoolingexampleimportload data設定神經網絡設定優化方法及損失函數訓練RNNLSTM影評分析importload預

2020-07-03 18:57:10

卷積神經網絡 Tensorflow

import tensorflow as tf #通過tf.get_variable的方式創建過濾器的權重變量和偏置項變量 filter_weight = tf.get_variable('weights',[5,3,3,16]

2020-07-03 12:03:23

24小時熱門文章

最新文章

最新評論文章