使用反向傳播算法訓練多層神經網絡（圖示）

原創

2018-09-05 01:15

本文爲翻譯內容，如下給出原文鏈接。

原文：Principles of training mult-layer neural network using backpropagation

鏈接：http://galaxy.agh.edu.pl/~vlsi/AI/backp_t_en/backprop.html

本文描述了使用反向傳播算法訓練多層神經網絡的過程。爲了更直觀的說明該訓練過程，使用如下圖所示的三層神經網絡，其中只有兩個輸入，一個輸出。

每個神經元由兩個單元組成：

第一個單元表示輸入信號的加權和（Xi爲輸入信號，Wi爲權重係數）；

第二個單元實現非線性函數（也稱爲神經元激活函數）；

如下圖，信號e爲線性輸出，y=f(e)爲非線性輸出，y也是當前神經元的輸出信號。

在訓練神經網絡時，我們需要用到訓練數據集。訓練數據集中包含輸入信號（X1和X2）以及相應的目標輸出（Z）。網絡訓練是一個迭代過程，在每次的迭代中，節點的權重係數會根據訓練集中的新數據進行修正。

一、計算初始參數

最初的權重係數按如下方法進行計算：

強制從訓練集的所有輸入信號開始（本例中只有X1和X2）
然後我們就能確定每一層網絡中每個神經元的輸出信號

符號w_(xm)n表示，網絡輸入x_m和神經元n之間的連接權重。符號y_n表示神經元n的輸出信號。

下面三個圖演示了輸入信號在網絡中是如何傳遞到第一層神經元的。

下面兩張圖是信號在隱藏層之間的傳遞，前一層的輸出作爲後一層的輸入。符號w_mn表示神經元m與下一層神經元n之間的連接權重。

下圖是輸出層的信號傳遞。

二、計算誤差信號

將網絡的輸出信號y與訓練集的目標輸出z進行比較，二者的差值稱爲輸出層神經元的誤差信號d 。

輸出層神經元的誤差信號是很好計算的，但是對於隱藏層來說，直接計算誤差信號是不可能的，因爲隱藏層神經元的目標輸出是未知的。在80年代中期反向傳播方法出現之前，都沒有什麼訓練多層網絡的有效方法。而反向傳播的思想就是，將輸出層的誤差信號反向傳播給所有的神經元，意味着所有神經元的輸出與輸入反向。

如下兩張圖是誤差信號傳遞到最後一個隱藏層的過程。

如下是隱藏層再向輸入方向的神經元進行誤差傳遞，權重係數w_mn 依然用於連接神經元m和神經元n，只是計算方向不同。

三、參數更新

當所有神經元的誤差信號都計算完成，就可以用於修正每個神經元輸入節點的權重係數了。在下面幾張圖的公式中， df(e)/de 表示神經元激活函數的導數。

係數h 影響神經網絡的學習速率，有一些方法可以用來選擇該參數。第一種方法是，選擇一個較大的學習速率，當初始權重係數確定之後，逐漸減小學習速率。第二種方法比較複雜，選擇一個較小的學習速率，在訓練過程中逐漸增大，最後階段再減小。採用第二種方法能夠確定權重係數的符號。

References
Ryszard Tadeusiewcz "Sieci neuronowe", Kraków 1992

其他參考：https://www.zhihu.com/question/27239198?rf=24827633

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

深度學習基礎——張量的通俗理解

轉載鏈接：https://www.cnblogs.com/abella/p/10142935.html 也許你已經下載了TensorFlow，而且準備開始着手研究深度學習。但是你會疑惑：TensorFlow裏面的Tensor，也就是“

2020-07-08 11:53:15

視頻目標分割之Video Object Segmentation using Space-Time Memory Networks

Video Object Segmentation using Space-Time Memory Networks 文章目錄Video Object Segmentation using Space-Time Memory Ne

2020-07-08 11:18:09

基於attention機制實現 CRNN OCR文字識別

定義網絡結構實現 BahdanauAttention，其中socre的實現方法爲 perceptron 形式 class BahdanauAttention(tf.keras.Model): def __init__(sel

2020-07-08 12:23:28

opencv 加載tensorflow pb模型

opencv加載的pb模型必須是用tf.layers 和 tf.nn 下的api構建的,使用slim會在加載時報未知的layer的錯誤基本流程: 1.加載pb bool CardDetect::load_model(string mo

2020-07-08 12:23:28

深度學習-攢機小記

預算1w以內吧。下面是英偉達DevBox的配置，可以作爲參考。 The DIGITS DevBox includes the following hardware and software: Four TITAN X GPU

2020-07-08 12:17:40

聊天機器人/對話生成

在這裏記錄一下聊天機器人方面的瞭解。算是一個Survey吧。聊天機器人有兩種技術方向： 1. 基於檢索 2. 基於生成模型術語 Generation based automatic chatting system Ne

2020-07-08 12:17:40

推薦系統系列（二）：從零開始搭建基於向量的推薦策略

從零開始搭建基於向量的推薦策略背景架構離線Pipeline搭建用戶行爲日誌上報日誌存儲到數據倉庫數據預處理模型訓練構建項目索引在線服務用戶向量預測最近項目查找總結參考背景向量召回/語義向量召回是現在流行的一種推薦策略，簡單來說

2020-07-08 12:17:27

論文解讀：Single path one-shot neural architecture search with uniform sampling

Single path one-shot neural architecture search with uniform sampling 1、總覽大多數搜索空間鬆弛化的方法裏，結構分佈是被連續地參數化了，這些參數在超網絡訓練時一同被

2020-07-08 12:06:15

深度學習論文中的一些術語（僅備份用，不定時更新）

hinge loss: 是機器學習領域中的一種損失函數，可用於“最大間隔(max-margin)”分類 hinge loss 函數是凸函數，因此機器學習中很多的凸優化方法同樣適用於 hinge loss empirical risk: 經

2020-07-08 12:04:52

深度學習_目標檢測_FPN論文詳解

FPN的創新點多層特徵特徵融合解決了目標檢測中的多尺度問題，通過簡單的網絡連接改變，在基本不增加原有模型計算量的情況下，大幅度提升小物體（small object）的檢測性能。在物體檢測裏面，有限計算量情況下，網絡的深

2020-07-08 11:57:07

深度學習_目標檢測_“YOLOv5”詳解（持續更新）

YOLOv5可以方便的進行工程化部署： YOLOv5（PyTorch）−>ONNX−>CoreML−>iosYOLOv5（PyTorch） -> ONNX -> CoreML -> iosYOLOv5（PyTorch）−>ONNX

2020-07-08 11:57:07

[深度之眼]LeNet/AlexNet/VGGNet/InceptionNet/ResNet實現fashion_mnist分類

本文使用五種經典卷積神經網絡，實現fashion_mnist十分類問題，並對比準確度和運行時間LeNet5 原理AlexNet8 原理VGGNet16 原理InceptionNet10 原理ResNet18 原理用到的包： im

2020-07-08 11:53:37

TensorFlow+CNN+OpenCV快速識別中文驗證碼

聲明:文章僅源自個人興趣愛好，不涉及他用，侵權聯繫刪。轉載請註明：轉自此博文https://leejason.blog.csdn.net/article/details/106150572 TensorFlow+CNN+Open

2020-07-08 11:43:39

apt-get update 卡在working 0 已解決

Ign:1 http://mirrors.163.com/ubuntu trusty InRelease Get:2 http://mirrors.163.com/ubuntu trusty-security InRelease

一蓑烟雨任平生yu

2020-07-08 11:20:23

深度學習調參技巧pdf . Free download!

這裏有一份深度學習的調參技巧《Neural Networks: Tricks of the Trade》收錄了許多論文裏提出的調參技巧。送給大家！鏈接: https://pan.baidu.com/s/1dtKVOYsu6pY

一蓑烟雨任平生yu

2020-07-08 11:20:22

24小時熱門文章

最新文章

最新評論文章