CNN模型之GoogLeNet(Inception) v2

一、介绍

2015年谷歌团队提出了Inception V2，首次提出了批量(Batch Normalization)归一化方法，可以提高网络的收敛速度。应用范围广泛。主要的创新点包括：

Batch Normalization：在神经网络的每层计算中，参数变化导致数据分布不一致，会产生数据的协方差偏移问题，通过对第i层的数据进行BN操作，也就是对数据进行归一化。可以将数据控制在一定的范围内，在输入到第i+1层。可以提高网络的收敛能力，较少dropout的使用。
将卷积核拆分：使用小的感受野代替大的感受野，v1版本中使用了 $5\times 5$ 的卷积核，v2版本使用两个 $3\times 3$ 的卷积核可以替代它。这样保证了感受野的范围还减少了参数量。并且增加了网络的深度，使表达能力更强。

二、模型结构

Batch Normalization实现

第一步：对网络某一层的输入样本做均值为0，方差为1的零均值化处理。使每一层的输入都服从相同的分布，克服内部协方差偏移的影响。
$\hat{x}^{(k)}=\frac{x^{(k)}-E[x^{(k)}]}{\sqrt{Var[x^{(k)}]}}$
其中， $E[x^{(k)}]$ 是样本均值， $\sqrt{Var[x^{(k)}]}$ 是样本方差。
第二步：因为数据量可能过多，因此选择每个batch来进行Normalization。得到BN的处理方式。

第三步：梯度反向传播，需要计算BN各个参数的梯度，公式如下

第四步：在推理阶段可以不适用BN，只需在训练阶段使用BN。完整流程如下：

三、总结

Inception v2主要包含两个创新：一是引入批量归一化。二是使用小的卷积核替换大的卷积核。批量归一化解决了协方差偏移的问题。让数据可控。即使使用大的学习率，网络也不会发生梯度消失或梯度爆炸的问题。减少了梯度对参数大小或初始值的依赖。还可以使用非线性饱和激活函数，因为可以避免陷入饱和状态。卷积核的替换则可以保证感受野的同时，增加网络的表达能力。

友情链接：
代码实现：https://github.com/guoyuantao/CNN_Model/tree/master/CNN_on_cifar_ByPytorch
联系方式：2391855138(加好友请备注)

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

CNN模型之GoogLeNet(Inception) v2

一、介绍

二、模型结构

Batch Normalization实现

三、总结

TDengine docker安装方法

vue项目获取富文本编辑器wangEditor内容导出为word（html转word格式并下载）

dotnet C# 创建 X11 应用时设置窗口背景颜色

vue3组件通信与props

sapui5

Alpine Linux apk add DNS lookup error

部分JDK版本的发布时间

工作中用到的脚本合集

合并代码时Beyond Compare设置

Navicat安装与激活教程

Pytorch學習之torch----數學操作(二)

keras學習筆記-----快速開始keras函數式API

生成對抗網絡(九)----------ACGAN

CNN模型之GoogLeNet(Inception) v2

CNN模型之NIN

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結