基本網絡結構簡介

1.AlexNet

博客直通車
詳解深度學習之經典網絡架構(二):AlexNet

AlexNet是雙cpu的流程。有5個卷積層,三個池化和三個全連接層。 11×11->3*3,5×5->3×3,3×3,3×3,3×3->3×3

在這裏插入圖片描述顯示 的卷積季後的特徵圖,池化的特徵圖沒有畫出來。
在這裏插入圖片描述2.vgg

論文中的結構簡介
在這裏插入圖片描述 由上圖所知,VGG一共有五段卷積,每段卷積之後緊接着最大池化層,作者一共實驗了6種網絡結構。分別是VGG-11,VGG-13,VGG-16,VGG-19,網絡的輸入是224*224大小的圖像,輸出是圖像分類結果(本文只針對網絡在圖像分類任務上,圖像定位任務上暫不做分析)。
vgg-16結構

下面算一下每一層的像素值計算:
輸入:224×224×3

  1. conv3 - 64(卷積核的數量):kernel size:3 stride:1 pad:1
    像素:(224-3+21)/1+1=224 22422464
    參數: (3
    3*3)*64 =1728
  2. conv3 - 64:kernel size:3 stride:1 pad:1
    像素: (224-3+12)/1+1=224 22422464
    參數: (3
    3*64)*64 =36864
  3. pool2 kernel size:2 stride:2 pad:0
    像素: (224-2)/2+1 = 112 11211264
    參數: 0
    4.conv3-128:kernel size:3 stride:1 pad:1
    像素: (112-3+21)/1+1 = 112 112112128
    參數: (3
    364)128 =73728
    5.conv3-128:kernel size:3 stride:1 pad:1
    像素: (112-3+2
    1)/1+1 = 112 112
    112128
    參數: (3
    3128)128 =147456
    6.pool2: kernel size:2 stride:2 pad:0
    像素: (112-2)/2+1=56 56
    56
    128
    參數:0
    7.conv3-256: kernel size:3 stride:1 pad:1
    像素: (56-3+21)/1+1=56 5656256
    參數:(3
    3128)256=294912
    8.conv3-256: kernel size:3 stride:1 pad:1
    像素: (56-3+2
    1)/1+1=56 56
    56256
    參數:(3
    3256)256=589824
    9.conv3-256: kernel size:3 stride:1 pad:1
    像素: (56-3+2
    1)/1+1=56 56
    56256
    參數:(3
    3256)256=589824
    10.pool2: kernel size:2 stride:2 pad:0
    像素:(56 - 2)/2+1=28 28
    28
    256
    參數:0
  4. conv3-512:kernel size:3 stride:1 pad:1
    像素:(28-3+21)/1+1=28 2828512
    參數:(3
    3*256)*512 = 1179648
  5. conv3-512:kernel size:3 stride:1 pad:1
    像素:(28-3+21)/1+1=28 2828512
    參數:(3
    3*512)*512 = 2359296
  6. conv3-512:kernel size:3 stride:1 pad:1
    像素:(28-3+21)/1+1=28 2828512
    參數:(3
    3512)512 = 2359296
    14.pool2: kernel size:2 stride:2 pad:0
    像素:(28-2)/2+1=14 14
    14
    512
    參數: 0
  7. conv3-512:kernel size:3 stride:1 pad:1
    像素:(14-3+21)/1+1=14 1414512
    參數:(3
    3*512)*512 = 2359296
  8. conv3-512:kernel size:3 stride:1 pad:1
    像素:(14-3+21)/1+1=14 1414512
    參數:(3
    3*512)*512 = 2359296
  9. conv3-512:kernel size:3 stride:1 pad:1
    像素:(14-3+21)/1+1=14 1414512
    參數:(3
    3512)512 = 2359296
    18.pool2:kernel size:2 stride:2 pad:0
    像素:(14-2)/2+1=7 7
    7
    512
    參數:0
    19.FC: 4096 neurons
    像素:114096
    參數:775124096 = 102760448
    20.FC: 4096 neurons
    像素:1
    14096
    參數:4096
    4096 = 16777216
    21.FC:1000 neurons
    像素:111000
    參數:4096*1000=4096000
    總共參數數量大約138M左右。

3.inception
博客直通車:

一文概覽Inception家族的「奮鬥史」

4.ResNet 慘差網絡

深度卷積神經網絡CNN中shortcut的使用
大話深度殘差網絡(DRN)ResNet網絡原理

5.FPN網絡

多尺度的object detection算法:FPN(feature pyramid networks)

6.感受野

卷積神經網絡中感受野的詳細介紹

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章