卷积神经网络(CNN)之入门篇

一、CNN的作用

  • 1、在图片的分类问题中,我们依旧需要根据训练集去判断测试集属于哪一个类别。图片是由不同的像素点组成,同一种动物不同的形态都会导致像素值的不同,通过CNN我们可以汇总得出图片中动物的整体特征,从而进行比对。在这里插入图片描述
  • 2、给定一张图片,是车还是马未知,是什么车也未知,现在需要模型判断这张图片里具体是一个什么东西,输出结果为:如果是车 那是什么车
  • 3.依据少量的特征识别出图片的类别,在下图中,我们只可以看见猫的一只眼睛,两只耳朵和一个嘴巴,没有其余的身体特征;我们人类可以一眼识别出这只猫,计算机如何根据少量的特征进行识别呢?
    在这里插入图片描述

二、CNN简介

  • 1、CNN的概念:卷积神经网络是一种带有卷积结构的深度神经网络,卷积结构可以减少网络占用的内存量,三个关键的操作分别是局部感受野(每一次只取一小部分)、权值共享(相当于一个滤波器)、pooling层(适当的降维),有效的减少了参数,缓解了过拟合的问题。
    (1)局部感受野:由于图像的空间联系是局部的,每个神经元不需要对全部的图像做感受,只需要感受局部特征即可,然后在更高层将这些感受得到的不同的局部神经元综合起来就可以得到全局的信息了,这样可以减少连接的数目。
    (2)权值共享(不同的权值相当于不同的特征进行过滤):不同神经元之间的参数共享可以减少需要求解的参数,使用多种滤波器去卷积图像就会得到多种特征映射。权值共享其实就是对图像用同样的卷积核进行卷积操作,也就意味着第一个隐藏层的所有神经元所能检测到处于图像不同位置的完全相同的特征。其主要的能力就能检测到不同位置的同一类型特征,也就是卷积网络能很好的适应图像的小范围的平移性,即有较好的平移不变性(比如将输入图像的猫的位置移动之后,同样能够检测到猫的图像)
  • 2、CNN的本质:本质还是一个多层感知机
  • 3、CNN 区别于 全连接神经网络:进行局部连接、权值共享的方式,降低模型的复杂度,减少过拟合的风险;减少了权值的数量,使得网络易于优化。
    全连接层有多大通过下图体会

在这里插入图片描述

  • 4、CNN的整体网络结构:
    (1)卷积神经网络是一种多层监督的神经网络,隐含层(卷积层+池采样层)是CNN特征提取功能的核心模块。
    (2)通过梯度下降法最小化损失函数对网络中的权重参数逐层反向调节,多次迭代训练提高精度。
    (3)卷积神经网络的组成由低隐层和高隐层组成;低隐层由卷积层和最大池采样层交替组成;高隐层是全连接层对应传统多层感知器中的隐含层和逻辑回归分类器。
    (4)第一个全连接层的输入是由卷积层和子采样层进行特征提取得到的特征图像。最后一层输出层是一个分类器(逻辑回归、Softmax回归、支持向量机)对输入图像进行分类。
  • 5、CNN神经网络的结构(具体在另一篇叙述)
    (1)数据的输入层:对数据做一些处理,比如去均值(把输入数据各个维度都中心化为0,避免数据过多偏差,影响训练效果)、归一化(把所有的数据都归一到同样的范围)、PCA/白化等等。CNN只对训练集做“去均值”这一步。
    (2)中间处理层:卷积计算层进行线性的乘积求和(CONV),激活层(RELU等激活函数),池化层进行区域取平均或最大值等操作(POOLING)
    (3)全连接层(当前采用全局平均池化层)
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章