神經網絡的反向傳播BP算法

原創

及时澍雨Timely

2020-02-20 19:50

簡介

神經網絡中經典的感知器模型，請參考我寫的這篇博客[ http://blog.csdn.net/ws_20100/article/details/48929383]

本篇博客是在感知器模型之後，討論由1986年由Rumelhart和McCelland提出的反向傳播學習算法。

------------------------------------------------------------------------------------------------------------------

反向傳播學習的BP算法

對於感知器模型，最初只能解決兩層神經網絡的學習訓練問題，對於多層網絡(例如三層)，便不能確定中間層的參數該如何調整。直到1986年，Rumelhart和McCelland等人提出了基於反向傳播的學習算法，用於前饋多層神經網絡的學習訓練。由於“反向傳播”的英文叫做Back-Propagation，所以這個算法也常常被學者簡稱爲BP算法。後來，人們對BP算法不斷改進，以加快其訓練速度，產生了很多版本的BP算法，例如Levenberg-Marquatdt算法等等。

1.)BP算法原理

如下圖，是一個多層神經網絡的示意圖，網絡相鄰層之間的單元採用全連接方法連接。

每個單元的輸入用U表示，輸出用X表示，權值用W表示。

式一：第k層第i個神經元的輸出，是由該神經元的輸入經過激活函數(Activition Function)得到：

式二：第k層第i個神經元的輸入，是由上一層神經元的輸出和權值向量內積得到：

式三：第m層(最終輸出層)第i個神經元輸出的誤差計算公式，採用LMS方式計算

以下的數學表示中的求導運算，均是由這三個基本公式推導而來。

2.)BP算法的步驟

反向傳播算法分爲兩步進行：

正向傳播：輸入的樣本從輸入層經過隱單元一層一層進行處理，通過所有的隱層之後，傳向輸出層。

反向傳播：把誤差信號按原來正向傳播的通路反向傳回，並對每個隱層的各個神經元的權係數進行修改，以使誤差信號趨向最小。

3.)BP算法的數學表示

BP算法的實質是，求取誤差函數最小值問題。

(1)而採用的方法是非線性規劃中的最速下降法，按照誤差函數的負梯度方向修改權係數。即

而

所以有，

(2)由於誤差的梯度，僅僅是“記爲”符號，並未給出明確計算公式：

所以，我們將求取上式中第k層第i個單元的誤差梯度：

這需要分類討論:

1.當第k層爲輸出層(k=m)時，

2.當第k層不是輸出層(k<m)時，

(3)所以最終的權係數修改公式：

其中，

(4)有時，爲了加快收斂速度，也考慮上一次權值的修改量：

------------------------------------------------------------------------------------------------------------------

總結

Back Propagation Algorithm，後向傳播算法，可以解決多層神經網絡的訓練問題。但是經過多年的研究顯示也存在着很多瓶頸，比如學習速度過慢，學習率難以確定，可能進入局部極小點，以及過擬合問題等等。

如有任何疑問，歡迎一起討論。

如要轉載本文，請註明出處：http://blog.csdn.net/ws_20100/

及時澍雨Timely

發佈了43 篇原創文章 · 獲贊 42 · 訪問量 39萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

opencv vs單步進入源碼配置

參考 https://www.bilibili.com/video/av89426577/ dll path：//添加到系統變量中，包含pdb文件的，非install內的路徑 D:\opencv4\cv430buildcud

2020-07-06 23:56:42

MyDLNote-Inpainting:[2019 ICCV] Free-Form Image Inpainting with Gated Convolution

Free-Form Image Inpainting with Gated Convolution 本文作者在 2018年 CVPR 上發表了一篇 Generative Image Inpainting with Contextual A

Phoenixtree_Zhao

2020-07-05 10:13:43

MyDLNote-Enhancement:[2020 CVPR] Domain Adaptation for Image Dehazing

2020 CVPR : Domain Adaptation for Image Dehazing [paper] : http://export.arxiv.org/pdf/2005.04668 這篇文章之所以能夠在 CVPR 發表，

Phoenixtree_Zhao

2020-07-05 10:13:42

MyDLNote-Enhancement: Kindling the Darkness: a Practical Low-light Image Enhancer （後附 KinD ++）

Kindling the Darkness: a Practical Low-light Image Enhancer 另外，推薦新的研究成果 KinD++。 [paper] : https://arxiv.org/pdf/1905.04

Phoenixtree_Zhao

2020-07-05 10:13:42

蒸餾法第二節——蒸餾法&分類任務

【1】A. Romero, N. Ballas, S. E. Kahou, A. Chassang, C. Gatta,and Y. Bengio. Fitnets: Hints for thin deep nets. arXiv pre

2020-07-03 09:27:35

蒸餾法第三節——蒸餾法&檢測任務

【1】G. Chen, W. Choi, X. Yu, T. Han, and M. Chandraker. Learning efficient object detection models with knowledge distil

2020-07-03 09:27:35

一種快速自適應的圖像二值化方法介紹 (Wellner 1993)

在手機模式識別的時候, 我們首先viewfinder裏面拿到的frame通常是RGB的或者YUV的, 如果我們需要用來做模式識別的話, 通常需要首先把彩色圖首先轉化成灰度圖. 對於RGB圖像而言, 網上有充足的公式, 比如Y = 0.29

2020-06-25 08:35:26

Wellner 1993快速自適應的圖像二值化方法的提高 (Derek Bradley and Gerhard Roth 2007)

前面一種方案實際上還是存在一定的問題的，就是這個避重就輕的初始g(n)值127*s(127表示0-255之間的中間值)，這個東西帶來的最直接的問題就是邊緣的效果在這個算法下是不咋地的。其實從這個所謂的"Wellner 1993"，

2020-06-25 08:35:26

【特徵匹配】SURF原理與源碼解析（二）

相關：SURF原理與源碼解析（一） SIFT原理與C源碼剖析上一篇已經詳細分析了SURF的原理，本篇分析opencv中的SURF源碼。轉載請註明出處：http://blog.csdn.net/luoshixian099/a

勿在浮砂筑高台

2020-06-23 09:06:07

通過libjpeg-turbo實現對jpeg圖像的解碼

之前在https://blog.csdn.net/fengbingchun/article/details/89715416中介紹過通過libjpeg-turbo接口實現將數據編碼或壓縮成jpeg數據並通過FILE的fwrite接口將其直

2020-06-22 10:25:35

YUV格式總結

視頻數據總要跟YUV打交道，由於不同公司組織基於對各自產品格式的定義不同，派生出各種各樣不同的YUV格式。總的來說，YUV從像素組織形式上來分有兩

一路向南_csdn

2020-06-22 08:07:55

完整的位圖文件解析

雲彩掛上的二叉樹 - http://blog.csdn.net/markl22222/archive/2011/04/06/6304318.aspx 與上次簡單的位圖加載不同,這次是完整的位圖格式解析.暫時沒有考慮壓縮格式的位圖. 下面的

2020-06-16 02:47:21

區域灰度差變換

用一個矩形掩模計算像素點的灰度範圍 halcon例子：engraved.hdev 原理：該像素點爲中心，所在矩形的最大灰度和最小灰度差。 void gray_range_rect(cv::Mat &src, cv::Mat &dst,

2020-06-16 00:44:49

Python圖像裁剪兩種方法 Pillow和OpenCV

使用OpenCV import cv2 img = cv2.imread("###.jpg") cropped = img[0:64, 0:128] # 裁剪座標爲[y0:y1, x0:x1] 使用Pillow from PIL

2020-06-15 05:54:08

基於神經網絡圖像取證：資源彙總

最近在做深度學習的圖像取證工作，做一下資源的彙總和科普、文獻的總結工作 1. 對圖像取證技術的總結 “誰動了我的圖片？” – 圖像取證技術文中主要介紹了幾種不同的圖像取證方法，簡述如下： I. copy-move 檢測方法

2020-06-09 03:31:46

24小時熱門文章

最新文章

最新評論文章