1. VGG:AlexNet的加强版(depth on its accuracy)
结构对比(卷积层 --> 卷积群)
2.实验中VGG卷积层深度设置
如上图所示:
红色箭头 表示 : 每个网络的结构设计(11层 -> 19层) (11层 : 8 conv. and 3 FC layers)
蓝色圈圈 表示 : 网络之间 卷积群深度增加 对比
3.补充
-
3 个 3 * 3 相当于 1 个 7 * 7, 使用小尺寸(3*3)滤波器原因:
(1) 有更多非线性变化- makes the decision function more discriminative
(2)参数更少
- 7 × 7 : 7平方*C平方 = 49*C平方 parameters - 3 个 3 x 3 : 3 * 3平方*C平方 = 27*C平方 parameters
-
C结构中增加了 1 * 1 的卷积层:
- a linear transformation of the input channels (降低维度,减少参数)
- increase the nonlinearity of the decision function without affecting the receptive fields of the conv. layers -
提出LRN没有用
-
深度增加,参数不会大变 (所有参数集中在全连接)
-
初始化权重 is important
4.输入数据处理
-
获得224*224
随机裁剪(randomly cropped from rescaled training images)
- Training image rescaling
水平翻转 randomhorizontal flipping
改变RGB通道 random RGB colour shift -
预处理:subtracting(减) the mean RGB value