反向傳播算法的公式推導（BP算法）

原創

Get achievement

2020-06-19 05:18

假設訓練的樣本集包含m個樣例，因爲此時對於單個樣本我們將神經網絡的代價函數定義爲：

其中h_W,b(x)爲輸入數據x經過神經網絡前向傳播得到的輸出結果，y爲期望值。
所以對於這個包含m個樣本集的數據集而言，整體的代價函數應爲：

上式關於J(W,b)定義中的第一項是一個均方差項。第二項是一個權重衰減項，其目的是減小權重的幅度，防止過度擬合。n_l 表示神經網絡的層數。s_l表示第 l 層神經元個數，不包含偏置單元。
在實際應用當中，我們使用批量梯度下降算法按照下面的公式來對神經網絡的參數（權重W和偏置b）進行優化：

這裏的 α 是學習速率，由上式可以發現問題的關鍵在於如何求解J(W,b)關於W和b的偏導數。這也就引出了本文所說的反向傳播算法，它是計算偏導數的很有效的方法。
我們知道整體代價函數J(W,b)跟單個樣本代價函數的關係，所以可得：

需要說明一點，第一行比第二行多出一項的原因在於權重衰減是作用於 W 而不作用於b上。
現在把原問題轉換成對下面兩個式子進行偏導求解：

因爲第 l+1 層第 i 個神經元的輸出 z_i^(l+1) 由下面的式子計算出：

所以可以再進一步的將單個樣本的代價函數J(W,b;x,y)對W求導化簡爲：

同理，單個樣本的代價函數J(W,b;x,y)對b求導可化簡爲：

因此問題就被轉化爲求解每一層每一個神經元所對應的殘差。定義第k個樣本在第l層第i個神經元上產生的殘差如下：

所以此時權值W_ij^(l)的更新公式爲：

偏置b_i^(l)的更新公式爲：

所以現在的核心問題只剩下一個了，就是殘差該如何進行求解？對於第n_l層（輸出層）的第 i 個神經元，利用下式來求解其對應的殘差：

然後計算倒數第二層即第 n_l −1層第 i 個神經元的殘差：

將上式中的 n_l −1與 n_l的關係替換爲l與l+1的關係，就可以得到：

所以單個樣本代價函數的偏導數的結果爲：

最後將求解得到的偏導數帶入權值W和偏置b更新公式中去得到：

因此，概括下來反向傳播算法主要包括以下幾個步驟：
（1）進行前饋傳導計算，利用前向傳導公式，得到L₂、L₃直到輸出層L_n的激活值。
（2）對輸出層（第n_l層），計算其殘差：

（3）對於l=n_l-1，n_l-2，…，2的各層，計算其對應的殘差：

（4）計算出每個神經元對應的偏導數值：

（5）將計算得到的偏導數值帶入到權重W和偏置b對應的更新公式中去：

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

24-5-18 X

自 3 月 31 號回來之後，這兩個月像是失去了方向一般，對很多事都提不起興趣。今天和 X 聊了聊，他還是以前那個熟悉的樣子。高中的時候，他是我們班裏公認的第一，我們是普通班，但他有着實驗班的實力，事實上，高考時他全校第三，後來去了美國

Higurashi-kagome

2024-06-01 14:30:43

【dubbo】如何測試一個dubbo服務呢？

rpc服務框架——dubbo https://cn.dubbo.apache.org/zh-cn/blog/2023/02/23/一文幫你快速瞭解-dubbo-核心能力/ 自制項目： https://github.com/Jinwenxin

金大鑫要堅持

2024-06-01 14:29:53

kubeconfig 多個集羣配置如何切換

kubectl config get-contexts kubectl config use-context <context-name> kubectl config current-context

2024-06-01 14:27:53

兩臺windowserver服務器配置Redis哨兵集羣

十年河東，十年河西，莫欺少年窮學無止境，精益求精 redis下載地址：https://github.com/tporadowski/redis/releases 這裏選擇壓縮版，不選擇安裝版 1、集羣環境主機master: 局域網

2024-06-01 14:24:12

oidc-client.js踩坑吐槽貼

前言前面選用了IdentityServer4做爲認證授權的基礎框架,感興趣的可以看上篇<微服務下認證授權框架的探討>,已經初步完成了authorization-code與implicit的簡易demo(html+js 在IIS部署的站點)

2024-06-01 14:23:02

微盟電商-以造數工廠爲底座的低成本自動化應用實現（一）

微盟電商-以造數工廠爲底座的低成本自動化應用實現 SAAS服務的特點是能夠以同一套代碼基礎，服務各種使用場景的客戶，由此帶來的業務組合與配置的多樣性是造成測試在造數環節以及自動化測試的實施階段面臨繁瑣與困難的根本原因。如何確保自動化的高效實

2024-06-01 14:20:12

Mac Brew install慢的問題

# 替換brew.git: jimmy@MacBook-Pro Library % cd "$(brew --repo)" jimmy@MacBook-Pro Homebrew % git remote set-url origin htt

2024-06-01 14:18:02

Vue devDependencies 與 dependencies 能別

Vue devDependencies 與 dependencies 能別，如何往項目的node_modules安裝組件概述 devDependencies 用於本地環境開發只會在開發環境下依賴的模塊，生產環境不會被打入包內（通過

2024-06-01 14:18:02

mysql 超大大數據庫複製前可執行的加速導入的SQL

use 數據庫;set global innodb_flush_log_at_trx_commit=0;set global max_allowed_packet=1024*1024*20;set global bulk_insert_bu

2024-06-01 14:14:21

css25 CSS Tables

https://www.w3schools.com/css/css_table.asp css25 CSS Tables CSS Tables The look of an HTML table can be greatly improv

2024-06-01 14:13:21

css29 CSS Layout - The z-index Property

https://www.w3schools.com/css/css_z-index.asp CSS Layout - The z-index Property The z-index property specifies th

2024-06-01 14:13:21

css28 CSS Layout - The position Property

https://www.w3schools.com/css/css_positioning.asp CSS Layout - The position Property The position property specifies t

2024-06-01 14:13:21

css26 CSS Layout - The display Property

https://www.w3schools.com/css/css_display_visibility.asp CSS Layout - The display Property The display property is

2024-06-01 14:13:21

css31 CSS Layout - float and clear

https://www.w3schools.com/css/css_float.asp CSS Layout - float and clear The CSS float property specifies how an

2024-06-01 14:13:21

css27 CSS Layout - width and max-width

https://www.w3schools.com/css/css_max-width.asp CSS Layout - width and max-width Using width, max-width and margi

2024-06-01 14:13:21

24小時熱門文章

最新文章

最新評論文章