卷积神经网络在分类层用卷积层代替全连接层的好处（附代码演示）

原創

Amigo瓜波

2020-06-26 23:54

先说一下结论：

好处：可以让卷积神经网络模型的训练集和测试集的图像大小不一样，如果是全连接层则必须输入图像的大小一致。

分析过程：

全连接层—代码演示具体操作

假设batch-size是1，最后的卷积层输出大小是5X5，通道数是512的话，如果接全连接层的话，就需要先reshape成一维的，这里的dim=12800（5X5X512），这里全连接层的权重矩阵大小就固定为了[12800,256]（全连接层有256个神经元）。如果训练集和测试集中的图像大小不一样，就会导致卷积层的输出大小不一样，从而reshape后就不是12800了，使得无法和权重矩阵相乘，就会报错。所以如果是用全连接层的话，那么训练集和测试集输入模型的图像大小必须一致。

卷积层代替全连接层—代码演示具体操作

通常这种做法是用全局池化（global_pool）和1X1的卷积核实现的，全局池化是不需要设置filter，无论特征图多大都只保留一个。假设batch-size是1，最后的卷积层输出大小是5X5，通道数是512，那么接一个全局池化后卷积层的输出就从5X5，变成了1X1（这也是一种正则化的手段），通道数还是512。这个1X1X512的矩阵和1X1的卷积核做卷积运算，其效果就等于全连接层，但是由于全局池化的存在，所以可以不固定输入模型的图像大小，因为最后全局池化后都会是1X1。这样就可以让训练集和测试集输入模型的图像大小不一致。

代码是通过reduce_mean实现全局池化，[1,2]是表示在图像的高度和宽度这两个维度。（如果是[1,2,3]就表示在图像的高度、宽度和通道数这三个维度）。

题外话：

下图代码是谷歌公司实现GoogleNet网络的分类层

代码也是池化+1X1卷积层的思想来作为全连接层，但是用的是传统池化层而不是全局池化，之所以池化层的filter大小是7X7，是因为上一层的卷积层输出的大小是7X7X1024，所以本质上效果等于全局池化，池化完的大小就是1X1X1024。不过这样的写法就导致GoogleNet的图像输入大小是固定的，只能是224X224，才会正好使最后一个卷积层的高度和宽度都是7。

致谢：AIZOO的指导让我比以前理解的更透彻了。感谢AIZOO的元峰，推荐关注他的公众号AIZOO，一个分享AI技术和资讯的好地方。主页链接：https://aizoo.com/。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

卷积神经网络在分类层用卷积层代替全连接层的好处（附代码演示）

容器中nginx无法使用同一个网络下的容器域名

Python: SunMoonTimeCalculator

NETCore中实现一个轻量无负担的极简任务调度ScheduleTask

docker使用特定的网络

使用c#强大的表达式树实现对象的深克隆之解决循环引用的问题

「Pygors跨平台GUI」2：安装MinGW-w64、MSYS2还是WSL2

「Pygors跨平台GUI」1：Pygors跨平台GUI应用研究

nodejs学习07——API

避免DbContext同时在多个线程调用

GPT-4o 引领人机交互新风向，向量数据库赛道沸腾了

tensorboard入門代碼

ResNet殘差網絡學習小結

深度學習的幾種權重初始化

卷積神經網絡在分類層用卷積層代替全連接層的好處（附代碼演示）

卷積神經網絡中關於全局平均池化代替全連接層、以及參數計算等的一些思考

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結