深度学习1：减小过拟合的方式

原創

jasonxu666

2019-09-02 17:39

参考：https://blog.csdn.net/heyongluoyao8/article/details/49429629

https://blog.csdn.net/Leo_Xu06/article/details/71320727

https://zhuanlan.zhihu.com/p/33058988?edition=yidianzixun&utm_source=yidianzixun&yidian_docid=0IAfAEZE

因为数据量的限制以及训练参数的增多，几乎所有大型卷积神经网络都面临着过拟合的问题，目前常用的防止过拟合的方法有下面几种：

1、data augmentation: 所有的过拟合无非就是训练样本的缺乏和训练参数的增加。一般要想获得更好的模型，需要大量的训练参数，这也是为什么CNN网络越来越深的原因之一，而如果训练样本缺乏多样性，那再多的训练参数也毫无意义，因为这造成了过拟合，训练的模型泛化能力相应也会很差。大量数据带来的特征多样性有助于充分利用所有的训练参数。data augmentation的手段一般有： 1）收集更多数据 2）对已有数据进行crop裁剪，flip翻转，加光照等操作 3）利用生成模型（比如GAN）生成一些数据。

2、weight decay：常用的weight decay有L1和L2正则化，L1较L2能够获得更稀疏的参数，但L1零点不可导。在损失函数中，weight decay是放在正则项（regularization）前面的一个系数，正则项一般指示模型的复杂度，所以weight decay的作用是调节模型复杂度对损失函数的影响，若weight decay很大，则复杂的模型损失函数的值也就大。

L1、L2正则的公式：https://blog.csdn.net/heyongluoyao8/article/details/49429629

3、提前终止：提前停止其实是另一种正则化方法，就是在训练集和验证集上，一次迭代之后计算各自的错误率，当在验证集上的错误率最小，在没开始增大之前停止训练，因为如果接着训练，训练集上的错误率一般是会继续减小的，但验证集上的错误率会上升，这就说明模型的泛化能力开始变差了，出现过拟合问题，及时停止能获得泛化更好的模型。如下图（左边是训练集错误率，右图是验证集错误率，在虚线处提前结束训练）：

4、dropout : CNN训练过程中使用dropout是在每次训练过程中随机将部分神经元的权重置为0，即让一些神经元失效，这样可以缩减参数量，避免过拟合，关于dropout为什么有效，有两种观点：1）每次迭代随机使部分神经元失效使得模型的多样性增强，获得了类似多个模型ensemble的效果，避免过拟合 2）dropout其实也是一个data augmentation的过程，它导致了稀疏性，使得局部数据簇差异性更加明显，这也是其能够防止过拟合的原因？3）它强迫一个神经单元，和随机挑选出来的其他神经单元共同工作，达到好的效果。消除减弱了神经元节点间的联合适应性，增强了泛化能力。关于dropout的解释可参考这篇博客https://blog.csdn.net/stdcoutzyx/article/details/49022443。单独使用 dropout 就可以使得模型获得良好表现，不过，如果搭配Max-Norm 食用的话，那么效果更佳https://zhuanlan.zhihu.com/p/33058988?edition=yidianzixun&utm_source=yidianzixun&yidian_docid=0IAfAEZE

5、bagging 和其他集成方法（主要用于机器学习中）

其实bagging的方法是可以起到正则化的作用,因为正则化就是要减少泛化误差,而bagging的方法可以组合多个模型起到减少泛化误差的作用. 在深度学习中同样可以使用此方法,但是其会增加计算和存储的成本.（bagging得到的各个模型对图像处理n次，投票得出结果）http://www.imooc.com/article/details/id/30564

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

深度学习1：减小过拟合的方式

anaconda3安裝及虛擬環境管理、pip

ubantu18.04 RTX2070使用anaconda3安裝pytorch

Kdevelop的使用

資源蒐集

Using sensor messages with tf（Using Stamped datatypes with tf::MessageFilter）

Mac下配置sublime實現LaTeX

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結