1. VGG:AlexNet的加強版(depth on its accuracy)
結構對比(卷積層 --> 卷積羣)
2.實驗中VGG卷積層深度設置
如上圖所示:
紅色箭頭 表示 : 每個網絡的結構設計(11層 -> 19層) (11層 : 8 conv. and 3 FC layers)
藍色圈圈 表示 : 網絡之間 卷積羣深度增加 對比
3.補充
-
3 個 3 * 3 相當於 1 個 7 * 7, 使用小尺寸(3*3)濾波器原因:
(1) 有更多非線性變化- makes the decision function more discriminative
(2)參數更少
- 7 × 7 : 7平方*C平方 = 49*C平方 parameters - 3 個 3 x 3 : 3 * 3平方*C平方 = 27*C平方 parameters
-
C結構中增加了 1 * 1 的卷積層:
- a linear transformation of the input channels (降低維度,減少參數)
- increase the nonlinearity of the decision function without affecting the receptive fields of the conv. layers -
提出LRN沒有用
-
深度增加,參數不會大變 (所有參數集中在全連接)
-
初始化權重 is important
4.輸入數據處理
-
獲得224*224
隨機裁剪(randomly cropped from rescaled training images)
- Training image rescaling
水平翻轉 randomhorizontal flipping
改變RGB通道 random RGB colour shift -
預處理:subtracting(減) the mean RGB value