一步一步教你反向傳播的例子

原創

2020-02-20 21:57

背景

反向傳播(Backpropagation)是訓練神經網絡最通用的方法之一，網上有許多文章嘗試解釋反向傳播是如何工作的，但是很少有包括真實數字的例子，這篇博文嘗試通過離散的數據解釋它是怎樣工作的。

Python實現的反向傳播

你能使用Python來實現反向傳播，我曾經在this Github repo上實現了反向傳播算法。

反向傳播的可視化

顯示神經網絡學習時相互作用的可視化，檢查我的Neural Network visualization。

另外的資源

如果你發現這個教程對你有用並且想繼續學習神經網絡以及它的應用，我強烈建議你看Adrian Rosebrock優秀的教程 Getting Started with Deep Learning and Python。

概述

對於這個教程，我們將使用2個輸入神經元、2個隱含層神經元以及2個輸出層神經元組成一個神經網絡，另外，隱含層和輸出層神經元各包含一個偏差。
這是基本結構：

目的讓神經網絡工作，我們對權重、偏差和訓練的輸入/輸出設置一個初始值：

反向傳播的目的是優化權重，以便於讓神經網絡學習怎樣正確的把任意的輸入映射到輸出中。

這篇教程的剩餘部分我們將要和單一的訓練集工作：輸入0.05和0.10，我們想要神經網絡輸出0.01和0.99。

前向反饋

爲了開始，當前給定權重和偏差以及輸入值0.05和0.10，神經網絡預測結果是什麼，我們需要把輸入值向前傳給網絡。

我們知道全部的輸入值傳到每個隱含層神經元中，使用激活函數擠壓全部的輸入值(在這裏，我們使用logistic函數)，對輸出層神經元重複這一過程。

計算h1 的輸入：

然後我們利用logistic函數把neth1 擠壓到h1 的輸出：

對h2 進行相同的操作：
outh2=0.596884378

對輸出層神經元重複操作，使用隱含層神經元的輸出作爲輸出層神經元的輸入。

這是o1 的輸出：

對o2 進行相同操作：
outo2=0.772928465

計算整體誤差

利用平方和誤差，我們能計算每個輸出層神經元的誤差：

例如，目標輸出o1 是0.01，但是神經網絡輸出是0.75136507，因此誤差是：

對o2 重複這個過程：
Eo2=0.023560026

神經網絡整體誤差：

反向傳播

反向傳播的目的是更新網絡中每個權重，以便他們真實的輸出值是接近目標輸出，從而最小化輸出層神經元的誤差。

輸出層

考慮w5 ，我們想要知道w5 怎樣影響整體誤差，即αEtotalαw5

應用鏈式規則：

可視化我們正在做的：

我們需要理解這個公式的每一步。

首先，output怎樣改變整體誤差？

下一步，net input怎樣改變o1 輸出？
logistic函數的偏導數是輸出乘以1減輸出：

最後，w5 怎樣改變o1 的net input？

把它們結合起來：

你常常能看到delta rule的結合形式：

我們利用αEtotalαouto1 和αouto1αneto1 來重寫αEtotalαneto1 ，我們使用這個重新上面的表達式：

因此：

爲了減少誤差，我們從當前權重減去這個值(乘以一個學習率，設置成0.5)：

我們能重複這個過程得到新的權重w6 ，w7 和w8 ：

當我們繼續下面的反向傳輸算法時，我們使用初始權重，而不是更新過的權重。

隱含層

下一步，我們將繼續向後計算w1 ，w2 ，w3 和w4 新值，這是我們需要理解的：

可視化：

我們將要對隱含層神經元使用相似的過程，但是稍微不同的是，每個隱含層神經元的輸出貢獻到多個輸出層神經元中。我們知道outh1 影響outo1 和outo2 ，因此αEtotalαouth1 需要考慮兩個輸出層神經元的影響：

αEtotalαouth1=αEo1αouth1+αEo2αouth1

先計算αEo1αouth1 :

αEo1αouth1=αEo1αneto1∗αneto1αouth1

使用稍早前計算的值來計算αEo1αneto1 ：

αEo1αneto1=αEo1αouto1∗αouto1αneto1=0.74136507∗0.186815602

αneto1αouth1 等於w5 :

neto1=w5∗outh1+w6∗outh2+b2∗1

αneto1αouth1=w5=0.40

合在一起：
αEo1αouth1=αEo1αneto1∗αneto1αouth1=0.138498562∗0.40=0.055399425

對αEo2αouto1 做相同的處理：

αEo2αouth1=−0.019049119

因此：

現在我們有αEtotalαouth1 ，我們還需要計算αouth1αneth1 ，然後對每個權重計算αneth1αw ：

我們計算h1 對w1 的偏導數：

把它們結合起來：

你也可以如下寫：

現在我們能更新w1 ：

對w2 ，w3 和w4 重複上面過程：

最後，我們更新所有權重，當我們把輸入0.05和0.1向前反饋，神經網絡的誤差爲0.298371109，在一次反向傳播後，整體誤差降到0.291027924，它看似不多，但是重複10000次之後，誤差大幅下降到0.000035085，在這之後，我們把輸入0.05和0.1向前反饋，那麼輸出的2個神經元生成0.015912196(vs 目標0.01)和0.984065734(vs 目標0.99)。

原文鏈接：A Step by Step Backpropagation Example

發佈了27 篇原創文章 · 獲贊 26 · 訪問量 14萬+

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

O2OA(翱途)開發平臺爲待辦創建配置郵件通知

O2OA(翱途)開發平臺[下稱O2OA開發平臺或者O2OA]的消息機制允許開發者通過配置實現郵件通知。本篇主要闡述如何實現待辦消息的郵件通知。一、先決條件： 1、O2Server服務器正常運行，系統安裝部署請參考

2024-05-09 23:10:17

理論+實踐，帶你瞭解分佈式訓練

本文分享自華爲雲社區《大模型LLM之分佈式訓練》，作者：碼上開花_Lancer。隨着語言模型參數量和所需訓練數據量的急速增長，單個機器上有限的資源已無法滿足大語言模型訓練的要求。需要設計分佈式訓練（Distributed Trainin

2024-05-08 22:38:41

安裝Auto-GPT

安裝 Python 3.8 或更高版本 https://phoenixnap.com/kb/how-to-install-python-3-ubuntu # 查看是否已經安裝了python python --version #更新包 sud

2024-05-12 22:43:51

雲效 Pipeline as Code 來了！這些場景，用好它效率翻倍！

從可視化編排到支持 YAML 編排雲效流水線 Flow 是開箱即用的企業級持續集成和持續交付工具，支持豐富的代碼源、構建、自動化測試工具、多種部署類型和部署方式，與阿里雲深度集成，還提供多種企業級特性，助力企業高效完成從開發到上線 CIC

2024-05-11 21:15:05

通義靈碼企業版正式發佈，滿足企業私域知識檢索、數據合規、統一管理等需求

5 月 9 日阿里雲 AI 峯會，阿里雲智能集團首席技術官周靖人宣佈，通義靈碼企業版正式發佈，滿足企業用戶的定製化需求，幫助企業提升研發效率。通義靈碼是國內用戶規模第一的智能編碼助手，基於 SOTA 水準的通義千問代碼模型 Code-Qw

2024-05-11 21:15:01

用Python寫的udp聊天器

說明在一個電腦中編寫1個程序，有2個功能 1.獲取鍵盤數據，並將其發送給對方 2.接收數據並顯示並且功能數據進行選擇以上的2個功能調用要求實現上述程序參考代碼 import socket def s

2024-05-11 12:30:57

Linux系統中的文件和目錄權限

一、文件屬性下文中，“文件”一詞默認代指廣義的數據類型，跟“目錄”等詞對比使用時，則專指普通文件（File）這一特定數據類型。 Linux系統中，我們可以使用命令“ls -al”來查看當前目錄

2024-05-11 01:45:47

手把手系列！使用 Zilliz Cloud 和 AWS Bedrock 搭建 RAG 應用

檢索增強生成（Retrieval Augemented Generation, RAG）是一種 AI 框架，它通過結合信息檢索和自然語言處理（NLP）能力從而增強文本生成。具體而言，RAG 系統中的語言模型通過一種檢索機制查詢和搜索知識庫

2024-05-10 21:29:43

詳解Python 中可視化數據分析工作流程

本文分享自華爲雲社區《Python 可視化數據分析從數據獲取到洞見發現的全面指南》，作者：檸檬味擁抱。在數據科學和分析的領域中，可視化是一種強大的工具，能夠幫助我們理解數據、發現模式，並得出洞見。Python 提供了豐富的庫和工具，使得可

2024-05-10 11:30:09

Apache DolphinScheduler 4月簡報：社區發展與技術革新速遞

各位熱愛 DolphinScheduler 的小夥伴們，4 月份的 DolphinScheduler 社區月報更新啦！這裏將記錄 DolphinScheduler 社區每月的重要更新，歡迎關注！月度 Merge 之星感謝以下小夥伴 4

2024-05-08 21:19:32

華爲雲開發者桌面全新發布CodeArts IDE for Python，極致優雅雲原生開發體驗

本文分享自華爲雲社區《華爲雲發佈CodeArts IDE for Python，極致優雅雲原生開發體驗》，作者：華爲雲頭條。近日，華爲雲正式發佈CodeArts IDE for Python，這是一款內置華爲自主創新的Python語

2024-05-08 10:34:25

Python 爬蟲：Spring Boot 反爬蟲的成功案例

前言在當今數字化時代，網絡數據成爲了信息獲取和分析的重要來源之一。然而，隨着網絡數據的廣泛應用，爬蟲技術也逐漸成爲了互聯網行業的熱門話題。爬蟲技術的應用不僅可以幫助企業獲取有價值的信息，還可以用於數據分析、市場研究等領域。然而，隨着爬

2024-05-07 23:26:04

開發者分享：利用 EMQX Cloud 與 ESP32 微控制器實現智能液冷散熱系統

作者：陶德坤，EMQX Cloud 開發者。作爲一名後端開發人員，我經常需要同時運行多個 Jetbrains IDE （集成開發環境），所以經常面臨筆記本電腦過熱問題。我曾嘗試過各種散熱方法，從傳統的風扇到更先進的半導體冷卻系統，但這些

2024-05-07 21:55:53

我們團隊來了一位新同事，主動要求幫忙敲代碼！歡迎 AI 001號

通義靈碼｜7X24的AI智能編程助手工號：AI001 他叫通義靈碼，一個硅基生命。出生在0101星球，沒有性別，但有人格類型。他是INTJ，建築師型人格，艾薩克·牛頓和甘道夫同款。他會寫一點代碼，但不如我們會得多。我看了下他的簡歷，

2024-05-07 21:12:06

頻繁FullGC線上問題排查

一、問題近期頻繁收到關於FullGC的告警二、基礎知識介紹 2.1 Java內存結構目前系統使用的是ParNewGC、CMS垃圾回收，此時的1.8JDK內存模型如下：注意大對象可以直接放到老年代中，可以通過-XX:Pretenur

2024-05-06 23:55:18

24小時熱門文章

最新文章

最新評論文章