淺析深度學習mini_batch的BP反傳算法

原創

2020-02-22 12:02

在深度學習中，如果我們已經定義了網絡，輸入，以及輸出，那麼接下來就是損失函數，優化策略，以及一般由框架完成的BP反傳。這篇博文我們主要探討一下深度的BP反傳算法（以梯度下降爲例），尤其是mini_batch的BP反傳，目標是如何更新網絡的參數：權重和偏置。

首先，我們來看網絡中基本參數的一些定義。

使用梯度下降法，一般計算所有樣本的損失函數的平均值，進而計算梯度方向。但是，當樣本n特別多的時候，計算會比較困難。因此，提出了隨機梯度下降的方法，即我們從樣本集中隨機抽取m個樣本，其計算的平均梯度近似於通過全部樣本計算的平均梯度。

當m=1時，SGD算法如下：

當m=k時，mini_batch算法如下：

通過對比m=1和m=k算法流程，我們發現，mini_batch方法的梯度是由mini_batch裏的樣本共同決定（平均值），計算出來的梯度一般比k=1的時候準確。

關於算法中的公式，我們通過以下方法進行推導：

參考資料：http://neuralnetworksanddeeplearning.com/index.html

何雷博客專家

發佈了76 篇原創文章 · 獲贊 226 · 訪問量 88萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

不同CUDA版本對應的最小GPU運算能力和最低兼容驅動

The minimum compute capability for various CUDA versions CUDA Version Minimum Compute Capability Default Compute

2020-07-07 08:17:52

PyTorch+YOLOv5環境搭建（未完待續）

PyTorch+YOLOv5環境搭建 PyTorch requirements NVIDIA CUDA 9.2 or above NVIDIA cuDNN v7 or above https://github.com/pyt

2020-07-07 07:39:14

OpenCV DNN 模塊-風格遷移

本文主要介紹OpenCV的DNN模塊的使用。OpenCV的DNN模塊自從contrib倉庫開始，就是隻支持推理，不支持訓練。但是僅僅只是推理方面，也夠強大了。現在OpenCV已經支持TensorFlow、Pytorch/Torc

2020-07-06 02:21:16

[DNN模塊開發]如何寫dnn文件

　　在所有DNN模塊的安裝包中，都有一個*.DNN文件。這個文件就是DNN模塊的安裝文件清單。在安裝模塊時DNN應用程序讀取該文件，按照文件清單中的內

2020-07-03 14:23:57

如何修改DotNetNuke(DNN)中服務條款和隱私說明

　在中國DNN的論壇上經常有人問道：“如何修改DNN中服務條款和隱私說明”。其實服務條款和隱私說明的內容都是語言包的一部份，不同的語言可以有不同的內容

2020-07-03 14:23:57

DNN交互設計-介紹（一）

用戶體驗設計是軟件開發中最重要的學科之一。要注意用戶體驗在軟件生命週期中不是一下子就可以完成的。好的用戶體驗需要基於用戶行爲和新的工具和技術的進行不斷地完善。現在DotNetNuke的認識到良好的用戶體驗對用戶和企業效益的重要性。DNN團

2020-06-25 01:53:40

多示例學習訓練網絡時，示例級別是否需要被標記?

最近在看基於深度學習的多示例學習，初入門，被這個問題困擾了好久！多示例中，示例級別的標籤未被給出。但要對網絡進行訓練的話，訓練集只給對應包級別標籤，如何進行訓練？示例級別不被標記如何訓練，需要標記的話該如何標記？會繼續查看相關論文

2020-06-21 08:10:35

深度模型：優化性能調參

調參調的是什麼？調整的是損失函數中的參數，這裏麪包含了正則參數和初始化。注意調參看驗證集。trainset loss通常能夠一直降低，但validation set loss在經過一段降低期後會開始逐漸上升，此時模型開始在訓練集上

2020-06-20 12:32:41

深度模型的CTR演進之路——知識點彙集

路線圖：忘記從哪位大神哪裏獲取的了，十分抱歉~~ 相應內容算法知識鏈接 Forest ResNet LR 線性迴歸原理及推導邏輯迴歸原理及推導 MF 矩陣分解方法ALS 矩陣分解方法處理隱式反饋 Embeddi

2020-06-20 05:30:13

TensorFlow中embedding_lookup()函數的意義，查表中的矩陣如何得到

1.embedding_lookup()函數調用參數 tf.nn.embedding_lookup(params, ids, partition_strategy='mod', name=None) params參數：可以是一個二位矩

2020-06-20 04:25:12

深度學習中過擬合、欠擬合現象以及解決方法

一、過擬合 1.過擬合現象過擬合（overfitting）是指在模型參數擬合過程中的問題，由於訓練數據包含抽樣誤差，訓練時，複雜的模型將抽樣誤差也考慮在內，將抽樣誤差也進行了很好的擬合。具體表現就是最終模型在訓練集上效果好；在測試集上效

2020-06-20 04:25:01

論文閱讀：Deep Learning in Mobile and Wireless Networking:A Survey

論文閱讀：Deep Learning in Mobile and Wireless Networking:A Survey 從背景介紹到未來挑戰，一文綜述移動和無線網絡深度學習研究近來移動通信和 5G 網絡等快速發展，它

2020-06-16 15:44:03

CNN卷積中卷積層，卷積核，通道概念及卷積過程詳解

1.卷積層，卷積核，通道概念及作用卷積層：又稱濾波器（filter）或者內核（kernel）,TensorFlow文檔中稱之爲濾波器（filter）。用於對輸入的圖像結構進行特徵提取。卷積核：同上卷積層。通道：指濾波器的個數。輸出的

2020-06-16 04:28:54

深度神經網絡（DNN）：卷積神經網絡（CNN）之激活函數大全

卷積神經網絡中激活函數，理論上可以是線性函數：例但是在模型中一般選用非線性的激活函數。 (1)sigmoid函數： (2)雙曲正切函數： (3)硬限幅函數 (4)斜面函數（5）修正線性單元函數（ReLU）（6）滲漏修正線性

2020-06-16 04:28:54

典型卷積網絡

本文介紹一些典型的深度卷積網絡 model model zoo in caffe, caffe model zoo wiki net layer num finetuned on dataset image num

2020-06-15 21:59:02

24小時熱門文章

最新文章

最新評論文章