1.AlexNet
博客直通車
詳解深度學習之經典網絡架構(二):AlexNet
AlexNet是雙cpu的流程。有5個卷積層,三個池化和三個全連接層。 11×11->3*3,5×5->3×3,3×3,3×3,3×3->3×3
顯示 的卷積季後的特徵圖,池化的特徵圖沒有畫出來。
2.vgg
論文中的結構簡介
由上圖所知,VGG一共有五段卷積,每段卷積之後緊接着最大池化層,作者一共實驗了6種網絡結構。分別是VGG-11,VGG-13,VGG-16,VGG-19,網絡的輸入是224*224大小的圖像,輸出是圖像分類結果(本文只針對網絡在圖像分類任務上,圖像定位任務上暫不做分析)。
vgg-16結構
下面算一下每一層的像素值計算:
輸入:224×224×3
- conv3 - 64(卷積核的數量):kernel size:3 stride:1 pad:1
像素:(224-3+21)/1+1=224 22422464
參數: (33*3)*64 =1728 - conv3 - 64:kernel size:3 stride:1 pad:1
像素: (224-3+12)/1+1=224 22422464
參數: (33*64)*64 =36864 - pool2 kernel size:2 stride:2 pad:0
像素: (224-2)/2+1 = 112 11211264
參數: 0
4.conv3-128:kernel size:3 stride:1 pad:1
像素: (112-3+21)/1+1 = 112 112112128
參數: (3364)128 =73728
5.conv3-128:kernel size:3 stride:1 pad:1
像素: (112-3+21)/1+1 = 112 112112128
參數: (33128)128 =147456
6.pool2: kernel size:2 stride:2 pad:0
像素: (112-2)/2+1=56 5656128
參數:0
7.conv3-256: kernel size:3 stride:1 pad:1
像素: (56-3+21)/1+1=56 5656256
參數:(33128)256=294912
8.conv3-256: kernel size:3 stride:1 pad:1
像素: (56-3+21)/1+1=56 5656256
參數:(33256)256=589824
9.conv3-256: kernel size:3 stride:1 pad:1
像素: (56-3+21)/1+1=56 5656256
參數:(33256)256=589824
10.pool2: kernel size:2 stride:2 pad:0
像素:(56 - 2)/2+1=28 2828256
參數:0 - conv3-512:kernel size:3 stride:1 pad:1
像素:(28-3+21)/1+1=28 2828512
參數:(33*256)*512 = 1179648 - conv3-512:kernel size:3 stride:1 pad:1
像素:(28-3+21)/1+1=28 2828512
參數:(33*512)*512 = 2359296 - conv3-512:kernel size:3 stride:1 pad:1
像素:(28-3+21)/1+1=28 2828512
參數:(33512)512 = 2359296
14.pool2: kernel size:2 stride:2 pad:0
像素:(28-2)/2+1=14 1414512
參數: 0 - conv3-512:kernel size:3 stride:1 pad:1
像素:(14-3+21)/1+1=14 1414512
參數:(33*512)*512 = 2359296 - conv3-512:kernel size:3 stride:1 pad:1
像素:(14-3+21)/1+1=14 1414512
參數:(33*512)*512 = 2359296 - conv3-512:kernel size:3 stride:1 pad:1
像素:(14-3+21)/1+1=14 1414512
參數:(33512)512 = 2359296
18.pool2:kernel size:2 stride:2 pad:0
像素:(14-2)/2+1=7 77512
參數:0
19.FC: 4096 neurons
像素:114096
參數:775124096 = 102760448
20.FC: 4096 neurons
像素:114096
參數:40964096 = 16777216
21.FC:1000 neurons
像素:111000
參數:4096*1000=4096000
總共參數數量大約138M左右。
3.inception
博客直通車:
4.ResNet 慘差網絡
深度卷積神經網絡CNN中shortcut的使用
大話深度殘差網絡(DRN)ResNet網絡原理
5.FPN網絡
多尺度的object detection算法:FPN(feature pyramid networks)
6.感受野