【深度学习误差计算】10分钟了解下均方差和交叉熵损失函数

原創

2020-02-22 09:52

常见的误差计算函数有均方差、交叉熵、KL 散度、Hinge Loss 函数等，其中均方差函数和交叉熵函数在深度学习中比较常见，均方差主要用于回归问题，交叉熵主要用于分类问题。下面我们来深刻理解下这两个概念。

1、均方差MSE。

预测值与真实值之差的平方和，再除以样本量。
均方差广泛应用在回归问题中，在分类问题中也可以应用均方差误差。

2、交叉熵

再介绍交叉熵损失函数之前，我们首先来介绍信息学中熵(Entropy)的概念。1948 年，Claude Shannon 将热力学中的熵的概念引入到信息论中，用来衡量信息的不确定度。熵在信息学科中也叫信息熵，或者香农熵。熵越大，代表不确定性越大，信息量也就越大。某个分布 (𝑖)的熵定义为

实际上，𝐻(p )也可以使用其他底数的log函数计算。举个例子，对于 4 分类问题，如果某个样本的真实标签是第 4 类，one-hot 编码为[0,0,0,1]，即这张图片的分类是唯一确定的，它属于第 4 类的概率P (y 𝑖s 4|𝑦) = 1，不确定性为 0，它的熵可以简单的计算为

也就是，对于确定的分布，熵为 0，即不确定性最低。分类问题的 One-hot 编码的分布就是熵为典型的例子。

发布了653 篇原创文章 · 获赞 795 · 访问量 188万+

他的留言板关注

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

【深度学习走进tensorflow2.0】TensorFlow binary was not compiled to use: AVX2

window10 本地安裝tensorflow cpu 版本 pip install tensorflow==2.0.0 安裝完成之後運行時總會顯示如下警告信息： Your CPU supports instructions

2020-06-28 20:12:30

【深度学习走进tensorflow2.0】TensorFlow 2.0 常用模块@tf.function

1、@tf.function 是幹什麼用的？雖然默認的 Eager Execution 爲我們帶來了靈活及易調試的特性，但在特定的場合（例如追求高性能或部署模型）時，我們依然希望使用圖模式，將模型轉換爲 TensorFlow 圖

2020-06-28 19:20:12

【深度学习走开tensorflow2.0】TensorFlow 2.0 常用模块tf.TensorArray

無意中發現了一個巨牛的人工智能教程，忍不住分享一下給大家。教程不僅是零基礎，通俗易懂，而且非常風趣幽默，像看小說一樣！覺得太牛了，所以分享給大家。點這裏可以跳轉到教程。人工智能教程在部分網絡結構，尤其是涉及到時間序列的結構中，我

2020-06-28 19:20:12

【深度学习走进tensorflow2.0】TensorFlow 2.0 常用模块tf.data

無意中發現了一個巨牛的人工智能教程，忍不住分享一下給大家。教程不僅是零基礎，通俗易懂，而且非常風趣幽默，像看小說一樣！覺得太牛了，所以分享給大家。點這裏可以跳轉到教程。人工智能教程背景：很多時候，我們希望使用自己的數據集來訓練

2020-06-28 19:20:12

【tensorflow 使用错误】tensorflow2.0 过程中出现 Error : Failed to get convolution algorithm

如果在使用 tensorflow 過程中出現 Error : Failed to get convolution algorithm ，這是因爲顯卡內存被耗盡了。解決辦法：在代碼的開頭加入如下兩句，動態分配顯存 physica

2020-06-28 19:20:12

【深度学习项目实战】Keras深度学习多变量时间序列预测的LSTM模型

無意中發現了一個巨牛的人工智能教程，忍不住分享一下給大家。教程不僅是零基礎，通俗易懂，而且非常風趣幽默，像看小說一樣！覺得太牛了，所以分享給大家。點這裏可以跳轉到教程。人工智能教程本篇文章將介紹基於Keras深度學習的多變量時間

2020-06-28 19:20:12

【深度学习走进tensorflow2.0】TensorFlow 2.0 常用模块tf.config

無意中發現了一個巨牛的人工智能教程，忍不住分享一下給大家。教程不僅是零基礎，通俗易懂，而且非常風趣幽默，像看小說一樣！覺得太牛了，所以分享給大家。點這裏可以跳轉到教程。人工智能教程本篇文章將會教大家如何合理分配顯卡資源，設置顯

2020-06-28 19:20:12

【深度学习走进tensorflow2.0】建立一个递归神经网络（LSTM）对MNIST数字集进行分类

無意中發現了一個巨牛的人工智能教程，忍不住分享一下給大家。教程不僅是零基礎，通俗易懂，而且非常風趣幽默，像看小說一樣！覺得太牛了，所以分享給大家。點這裏可以跳轉到教程。人工智能教程使用CNN進行圖像分類是很稀疏平常的，其實使用R

2020-06-28 19:20:12

【深度学习模型压缩】10分钟了解下模型压缩的常用方法

一、什麼是模型壓縮？模型壓縮的目標是保證模型預測效果的前提下，儘可能地降低模型的大小二、爲什麼要進行模型壓縮？ 1. 模型壓縮後，模型很小，進行推斷的運算量小，利於在移動端部署。 2. 諸如Bert等深度學習的參數太多了，模

2020-06-28 19:19:59

【GPU linux环境搭建】10分钟了解下centos 下 GPU搭建过程

無意中發現了一個巨牛的人工智能教程，忍不住分享一下給大家。教程不僅是零基礎，通俗易懂，而且非常風趣幽默，像看小說一樣！覺得太牛了，所以分享給大家。點這裏可以跳轉到教程。人工智能教程主要內容 1、深度學習顯卡驅動安裝 2、cuda

2020-06-28 19:19:59

【强化学习--Qlearning】快速入门Q-learning强化学习思想

2020-04-20 11:03:57

【tensorflow2.0 图片数据】tensorflow中准备图片数据的常用方案

2020-04-10 15:44:05

【深度学习走进tensorflow2.0】TensorFlow 2.0 常用模块TFRecord

2020-02-22 09:52:51

【深度学习走进tensorflow2.0】TensorFlow 2.0 常用模块：tf.data 数据流加速

2020-02-22 09:52:41

【深度学习走进tensorflow2.0】window10安装GPU 版本 TensorFlow 安装指南

2020-02-22 09:52:41

24小時熱門文章

SQL优化-20231016

最新文章

最新評論文章