CNN基本结构和经典网络

原創

2019-03-18 18:18

卷积网络的基本结构

数据输入层/ Input layer

3种常见的图像数据处理方式：一般CNN只用去均值

卷积计算层/ CONV layer

基本概念：

depth:与神经元（filter）个数相等
stribe
zero-padding

卷积宽长深度计算：

$W_{2}=(W_{1}-F+2P)/S+1$

$H_{2}=(H_{1}-F+2P)/S+1$

激励层(ReLU)

 Sigmoid
 Tanh(双曲正切)
 ReLU
 Leaky ReLU
 ELU

 Maxout

池化层 / Pooling layer

 夹在连续的卷积层中间
 压缩数据和参数的量，减小过拟合

池化之后的宽高计算如下：（eg：一个2*2，S=2，池化之后刚好是原来图像的一半

$W_{2}=(W_{1}-F)/S+1$

$H_{2}=(H_{1}-F)/S+1$

典型CNN结构

LeNet

AlexNet

分了两组：8层结构（5卷积层+3全连接）跟LeNet相比深度加深，每层神经元数减少

ZF Net

可以理解为对AlexNet进行了微调。

VGGNet

VGG-16有16个卷积层或全连接层，包括五组卷积层和3个全连接层，即：16=2+2+3+3+3+3。

1、输入224x224x3的图片，经64个3x3的卷积核作两次卷积+ReLU，卷积后的尺寸变为224x224x64

2、作max pooling（最大化池化），池化单元尺寸为2x2（效果为图像尺寸减半），池化后的尺寸变为112x112x64

3、经128个3x3的卷积核作两次卷积+ReLU，尺寸变为112x112x128

4、作2x2的max pooling池化，尺寸变为56x56x128

5、经256个3x3的卷积核作三次卷积+ReLU，尺寸变为56x56x256

6、作2x2的max pooling池化，尺寸变为28x28x256

7、经512个3x3的卷积核作三次卷积+ReLU，尺寸变为28x28x512

8、作2x2的max pooling池化，尺寸变为14x14x512

9、经512个3x3的卷积核作三次卷积+ReLU，尺寸变为14x14x512

10、作2x2的max pooling池化，尺寸变为7x7x512

11、与两层1x1x4096，一层1x1x1000进行全连接+ReLU（共三层）

12、通过softmax输出1000个预测结果

注意内存的计算

GoogLeNet

去掉了全连接层

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

浅析CNN卷积神经网络feature map

個人學習CNN的一些筆記，比較基礎，整合了其他博客的內容 feature map的理解在cnn的每個卷積層，數據都是以三維形式存在的。你可以把它看成許多個二維圖片疊在一起（像豆腐皮豎直的貼成豆腐塊一樣），其中每一個稱爲一個

2020-07-07 11:11:21

论文笔记之Fully Convolutional Networks for Semantic Segmentation

最近了解到了Image Semantic Segmentation方面的知識，在此做一個記錄。這篇論文是2015cvpr的best paper，可以說是在cnn上做圖像語義分割的開山之作。 1.語義分割定義：語義就是指物體的

2020-07-08 10:23:34

2018.8.8 kaggle 图像分类项目

1.今天接到一個電話面試，上來就問我怎麼檢查單鏈表有環。思路：如果一個單鏈表中有環，用一個指針去遍歷，永遠不會結束，所以可以用兩個指針，一個指針一次走一步，另一個指針一次走兩步，如果存在環，則這兩個指針會在環內相遇，時間

2020-07-08 05:52:34

MNIST数据集手写数字识别

pytorch的MNIST數據集手寫數字識別(GPU) 數據集介紹 MNIST 包括6萬張28x28的訓練樣本，1萬張測試樣本，很多教程都會對它”下手”幾乎成爲一個 “典範”，可以說它就是計算機視覺裏面的Hello World。所

2020-07-08 05:29:48

基于时空图卷积模型的分析归纳

名稱 ST-GCN 目的解決基於人體骨架關鍵點的人類動作識別問題優點 1、空間關係利用人類關節空間關係理解人類行爲2、層次性ST-GCN 的層次性消除了手動劃分部分或遍歷規則的需要。這不僅能獲得更強的表達能力

2020-07-07 11:11:22

图卷积-动作识别-姿态预测三篇论文归纳

名稱 Actional-Structural Graph Convolutional Networks forSkeleton-based Action Recognition Convolutional Neural Ne

2020-07-07 11:11:21

TensorFlow学习笔记（二）深层神经网络与优化算法

三、深度學習與深層神經網絡 1、介紹深度學習特性：多層和非線性線性模型侷限性：只通過線性變換，任意層的全連接神經網絡和單層神經網絡模型的表達能力沒有任何區別。線性模型能夠解決的問題是有限的——這是它的

2020-07-07 11:11:19

【论文笔记】Convolutional Neural Networks for Sentence Classification

paper鏈接 https://arxiv.org/abs/1408.5882 閱讀這篇paper的一些筆記： Abstract 本文將CNN和NLP結合；介紹了一系列的對比實驗，實驗結果說明了：一個簡單的（單層神經網絡

2020-07-06 18:40:30

图像风格迁移——《A Neural Algorithm of Artistic Style》

之前看到別人玩圖像風格遷移，感覺挺有意思的，趁着空下來的時間自己玩了一下。還是沿着老方法，先看一下論文，然後跑跑程序。論文看的是最基礎的《A Neural Algorithm of Artistic Style》，程序嘛，當然不是笨妞自己

2020-07-05 15:00:45

基于全卷积的图像语义分割—《Fully Convolutional Networks for Semantic Segmentation》

兩年前，我曾想做一個自動摳“人”的系統，目標是去除路人甲或者自動合成照片。當時“井底之蛙”般搞了一個混合高斯模型，通過像素聚類的方式來摳“人”。這個模型，每跑一張小圖片需要幾分鐘，摳出來的前景“噪音”很嚴重，完全沒辦法使用。最後這個通過“

2020-07-05 15:00:45

Deep dream——《Going Deeper into Neural Networks》

deep dream的體驗和以往看論文，跑例子的過程完全不同。這是在跑“風格遷移”的例子時，在keras的examples中無意看到了程序，然後順帶跑一跑的。跑出來的效果讓我覺得和無厘頭，於是讀程序，看它到底幹了些啥。程序風格也很特別，沒

2020-07-05 15:00:45

卷积神经网络-BN、Dropout、leaky_relu (tensorflow)

神經網絡是一種比較難以理解的結構，關於神經網絡的各種層次的說明解釋，大家請移步百度、google 本次的分享會從人類視覺角度、生物角度談一談神經網絡中的一些優化算法。首先，計算機領域設計出來的算法、模型和數據結構，都可以理解爲一種建

罗小丰同学

2020-07-04 03:54:05

ImageDataGenerator生成器的flow，flow_from_directory用法总结，及自己踩的坑【原创】

踩坑：一直都不知其問題出在哪，如報錯： ValueError: Error when checking target: expected sequential_1 to have shape (2,) but got array wit

2020-07-04 02:49:22

tensorflow & keras

文章目錄Mnist模型定義keras層優化算法及損失函數文字識別模型檢驗CNNFilterpoolingexampleimportload data設定神經網絡設定優化方法及損失函數訓練RNNLSTM影評分析importload預

2020-07-03 18:57:10

卷积神经网络 Tensorflow

import tensorflow as tf #通過tf.get_variable的方式創建過濾器的權重變量和偏置項變量 filter_weight = tf.get_variable('weights',[5,3,3,16]

2020-07-03 12:03:23

24小時熱門文章

最新文章

最新評論文章