深度学习入门之 基本概念

1、机器学习:

根据我的理解,机器学习就是让电脑自动学习或者是训练出一个好的模型来解决实际问题。

图一  机器学习

如上图所示,模型类似于函数,输入可能为向量(图像矩阵转化为向量输入),输出可能为离散值如分类问题(比如手写数字预测),也可能是连续值是回归问题(比如预测房屋面积与工资的关系)。

机器学习可以分为三类:监督学习、非监督学习、强化学习

  • 监督学习:是知道正确答案,根据训练样本不停的学习,使模型学习到一种规则(或是调节权值,使结果最优)。
  • 无监督学习:没有输出,只有大量的样本,机器自己从大量的样本中找出规律。
  • 强化学习:没有样本之类的东西,只有主体和环境,通过价值和奖励这两个概念,主体和环境不断地交互来学习,最后达成一个目标。(好像阿尔法狗的弟弟就是自己和自己下棋,而不是通过输入大量棋局来学习的,具体我也不太清楚)

2、监督学习:

简单的介绍几种监督学习模型:

  • 逻辑回归:比如简单的线性模型y=\omega ^{\tau }x+b 用其进行简单的分类 。
  • 支持向量机(SVM): 首先SVM可以使用核函数来处理非线性的场景。其基本思想就是划分的直线距离两类数据的间隔越大越好(如下图的H3直线就是最佳的选择)。

                     

         

  • 朴素贝叶斯分类器:假设样本的特征在给定分类条件下是相互独立的。该模型利用贝叶斯公式来进行统计计算,实现分类的作用。

3、衡量模型的指标:

简单介绍准确率、精度、召回率:

  • 准确率:准确预测的数量除以总的样本数量。
  • 精度:正确预测的样本数量除以该分类样本的数量。
  • 召回率:正确预测的样本数量除以预测成该分类的数量。

是不是还是不太理解?用例子介绍一下,如下图第一行的5,2,0分别表示:5只猫被预测为猫,2只狗被预测为猫,0只兔子被预测成猫。第一列5,3,0表示:5只猫被预测为猫,3只猫被预测为狗,0只猫被预测成兔子。下面我们来说一下三个值是如何计算的:

  • 准确率=(5+3+11)/27(5+3+11)/27   即对角线之和除以全部数据的和。
  • 精度(以狗的精度为例)=3/(3+3+2) 预测正确的数量/所在行
  • 召回率(以狗为例)=3/(2+3+1) 预测正确的数量/所在列

             

4、损失函数:

通过数据训练,如很判断数据训练最后的好坏呢?损失函数(或者目标函数)来衡量参数的好坏,知道了好坏才能进行对权重参数的修改啊。损失函数有许多求法,如交叉熵等。或者简单地说,你可以把最后的结果与答案求差、绝对值或者求平方。

5、优化:

模型最重要的就是优化,通过损失函数来进行不断地调整优化,那么如何进行优化那?目前常见的是梯度优化,梯度优化又有三个变种:随机梯度下降SGD、批量梯度下降BGD、小批量梯度下降MBGD。参考博文https://blog.csdn.net/weixin_42152164/article/details/80994466      https://blog.csdn.net/philthinker/article/details/80615122

6、过拟合:

过分的抓取数据的特征,结果本末倒置没有学习到数据的特征。如下图所示,常见的预防过拟合的方法有利用Dropout方法、或数据增强,具体可以自己百度一下。

第三个表示过拟合

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章