BP神經網絡

原創

2020-02-24 20:52

轉自：BP神經網絡，保存在此以學習。

BP（Back Propagation）網絡是1986年由Rumelhart和McCelland爲首的科學家小組提出，是一種按誤差逆傳播算法訓練的多層前饋網絡，是目前應用最廣泛的神經網絡模型之一。BP網絡能學習和存貯大量的輸入-輸出模式映射關係，而無需事前揭示描述這種映射關係的數學方程。

一個神經網絡的結構示意圖如下所示。

BP神經網絡模型拓撲結構包括輸入層（input）、隱層(hide layer)和輸出層(output layer)。輸入層神經元的個數由樣本屬性的維度決定，輸出層神經元的個數由樣本分類個數決定。隱藏層的層數和每層的神經元個數由用戶指定。每一層包含若干個神經元，每個神經元包含一個而閾值，用來改變神經元的活性。網絡中的弧線表示前一層神經元和後一層神經元之間的權值。每個神經元都有輸入和輸出。輸入層的輸入和輸出都是訓練樣本的屬性值。

對於隱藏層和輸出層的輸入其中，是由上一層的單元i到單元j的連接的權；是上一層的單元i的輸出；而是單元j的閾值。

神經網絡中神經元的輸出是經由賦活函數計算得到的。該函數用符號表現單元代表的神經元活性。賦活函數一般使用simoid函數（或者logistic函數）。神經元的輸出爲：

除此之外，神經網絡中有一個學習率（l）的概念，通常取0和1之間的值，並有助於找到全局最小。如果學習率太小，學習將進行得很慢。如果學習率太大，可能出現在不適當的解之間擺動。

交代清楚了神經網絡中基本要素，我們來看一下BP算法的學習過程：

BPTrain(){

初始化network的權和閾值。

while 終止條件不滿足 {

for samples中的每個訓練樣本X {

// 向前傳播輸入

for 隱藏或輸出層每個單元j {

；// 相對於前一層i，計算單元j的淨輸入；// 計算單元j的輸出

}

// 後向傳播誤差

for 輸出層每個單元j {

；// 計算誤差

}

for 由最後一個到第一個隱藏層，對於隱藏層每個單元j {

；// k是j的下一層中的神經元

}

for network中每個權 {

； // 權增值

； // 權更新

}

for network中每個偏差 {

； // 偏差增值

；// 偏差更新

}

}

}

算法基本流程就是：

1、初始化網絡權值和神經元的閾值（最簡單的辦法就是隨機初始化）

2、前向傳播：按照公式一層一層的計算隱層神經元和輸出層神經元的輸入和輸出。

3、後向傳播：根據公式修正權值和閾值

直到滿足終止條件。

算法中還有幾點是需要說明的：

1、關於，是神經元的誤差。

對於輸出層神經元，其中，是單元j的實際輸出，而是j基於給定訓練樣本的已知類標號的真正輸出。

對於隱藏層神經元，其中，是由下一較高層中單元k到單元j的連接權，而是單元k的誤差。

權值增量是，閾值增量是，其中是學習率。

對於的推導採用了梯度下降的算法。推導的前提是保證輸出單元的均方差最小。，其中P是樣本總數，m是輸出層神經元個數是樣本實際輸出，是神經網絡輸出。

梯度下降思路就是對求的導數。

對於輸出層：

其中的就是。

對於隱藏層：

其中=就是隱藏層的誤差計算公式。

2、關於終止條件，可以有多種形式：

§ 前一週期所有的都太小，小於某個指定的閾值。

§ 前一週期未正確分類的樣本百分比小於某個閾值。

§ 超過預先指定的週期數。

§ 神經網絡的輸出值和實際輸出值的均方誤差小於某一閾值。

一般地，最後一種終止條件的準確率更高一些。

在實際使用BP神經網絡的過程中，還會有一些實際的問題：

1、樣本處理。對於輸出，如果只有兩類那麼輸出爲0和1，只有當趨於正負無窮大的時候纔會輸出0，1。因此條件可適當放寬，輸出>0.9時就認爲是1，輸出<0.1時認爲是0。對於輸入，樣本也需要做歸一化處理。

2、網絡結構的選擇。主要是指隱藏層層數和神經元數決定了網絡規模，網絡規模和性能學習效果密切相關。規模大，計算量大，而且可能導致過度擬合；但是規模小，也可能導致欠擬合。

3、初始權值、閾值的選擇，初始值對學習結果是有影響的，選擇一個合適初始值也非常重要。

4、增量學習和批量學習。上面的算法和數學推導都是基於批量學習的，批量學習適用於離線學習，學習效果穩定性好；增量學習使用於在線學習，它對輸入樣本的噪聲是比較敏感的，不適合劇烈變化的輸入模式。

5、對於激勵函數和誤差函數也有其他的選擇。

總的來說BP算法的可選項比較多，針對特定的訓練數據往往有比較大的優化空間。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也稱爲文本反轉，是在 Stable Diffusion 中控制圖像樣式的另一種方法。在這篇文章中，我們將學習什麼是嵌入，在哪裏可以找到它們，以及如何使用它們。什麼是嵌入embe

2024-04-25 21:31:13

京東廣告研發 —— 京東推薦廣告排序機制演化

1、序言：廣告排序機制的前世今生 1.1、簡介：廣告排序機制在線廣告是國內外各大互聯網公司的重要收入來源之一，而在線廣告與傳統廣告最大的區別就在於其超大規模的實時競價環境：數以萬計的廣告主在一天內可以參與億級別的流量競拍。在這複雜的實

2024-04-24 23:17:14

03-爲啥大模型LLM還沒能完全替代你？

1 不具備記憶能力的它是零狀態的，我們平常在使用一些大模型產品，尤其在使用他們的API的時候，我們會發現那你和它對話，尤其是多輪對話的時候，經過一些輪次後，這些記憶就消失了，因爲它也記不住那麼多。 2 上下文窗口的限制大模型對其inpu

2024-04-23 01:07:00

輕鬆復現一張AI圖片

輕鬆復現一張AI圖片現在有一個非常漂亮的AI圖片，你是不是想知道他是怎麼生成的？今天我會交給大家三種方法，學會了，什麼圖都可以手到擒來了。需要的軟件在本教程中，我們將使用AUTOMATIC1111 stable diffusio

2024-04-22 21:30:45

01-大語言模型發展

AI大模型的相關的一些基礎知識，一些背景和基礎知識。多模型強應用AI 2.0時代應用開發者的機會。 0 大綱 AI產業的拆解和常見名詞應用級開發者，在目前這樣一個大背景下的一個職業上面的一些機會實戰部分的，做這個agent，即所謂智

2024-04-22 01:12:50

AI從入門到入門之手寫數字識別模型java方式Dense全連接神經網絡實現

前言：授人以魚不如授人以漁.先學會用，在學原理，在學創造，可能一輩子用不到這種能力，但是不能不具備這種能力。這篇文章主要是介紹算法入門Helloword之手寫圖片識別模型java中如何實現以及部分解釋。目前大家對於人工智能-機器學習-神經網

2024-04-19 23:17:21

深入解析大模型NLP LLaMa

在人工智能和自然語言處理（NLP）領域，LLaMa（Language-Model-driven Learning, aMplification and aDAptation）流程已經成爲處理大規模模型訓練的關鍵技術。它基於語言模型的學習、增

2024-04-18 11:29:54

文檔圖像大模型

隨着信息技術的快速發展，文檔處理已經成爲日常生活和工作中不可或缺的一部分。傳統的文檔處理方法往往需要人工參與，效率低下且易出錯。近年來，隨着深度學習技術的突破，文檔圖像大模型在智能文檔處理領域嶄露頭角，爲提升文檔處理性能提供了新的解決方案。

2024-04-18 11:29:52

從零開始學習大模型

隨着人工智能技術的快速發展，大模型已成爲許多領域的熱門話題。然而，大模型的創建並不是一件容易的事情。在本文中，我們將從零開始學習如何創建一個大模型，幫助讀者掌握大模型的創建過程。一、數據收集創建大模型的首要任務是收集數據。數據是大模型的

2024-04-16 11:29:26

倒計時4天！百度Create AI開發者大會“大模型與深度學習技術”論壇亮點搶鮮看！

作爲人工智能的核心基礎技術，深度學習具有很強的通用性，大模型技術在深度學習的基礎上，通過構建更加龐大神經網絡模型和應用transformer等更加領先的算法，使模型的處理能力產生質的飛躍。飛槳（PaddlePaddle）以百度多年的深度學習

2024-04-12 21:33:07

深度解析大模型推理框架：原理、應用與實踐

在當今數據驅動的時代，大模型推理框架已經成爲人工智能領域的重要支柱。本文將通過簡明扼要、清晰易懂的方式，帶領讀者深入瞭解大模型推理框架的原理、應用領域和實踐經驗，幫助讀者更好地掌握這一技術，並在實際工作中發揮其價值。一、大模型推理框架簡介

2024-04-11 23:28:49

金融領域中的大模型Lora微調：實戰應用與性能優化

隨着金融行業的快速發展，大數據和人工智能技術的應用越來越廣泛。在這個背景下，深度學習模型在金融領域的應用逐漸受到重視。然而，傳統的深度學習模型在金融場景中面臨着數據量大、模型複雜度高、計算資源有限等挑戰。爲了解決這個問題，Lora框架應運而

2024-04-11 23:28:47

RAG 修煉手冊｜一文講透 RAG 背後的技術

在之前的文章中《RAG 修煉手冊｜RAG敲響喪鐘？大模型長上下文是否意味着向量檢索不再重要》，我們已經介紹過 RAG 對於解決大模型幻覺問題的不可或缺性，也回顧瞭如何藉助向量數據庫提升 RAG 實戰效果。今天我們繼續剖析 RAG，將爲大

2024-04-10 21:20:11

一站式解讀多模態——Transformer、Embedding、主流模型與通用任務實戰（上）

本文章由飛槳星河社區開發者高宏偉貢獻。高宏偉，飛槳開發者技術專家（PPDE），飛槳領航團團長，長期在自媒體領域分享 AI 技術知識，博客粉絲 9w+，飛槳星河社區 ID 爲 GoAI 。分享分爲上下兩期，本期分享從多模態概念與意義、任務類型

2024-04-08 11:42:41

百億大規模圖在廣告場景的應用

本文通過搜索推薦項目進行外賣搜索廣告弱供給填充，提高流量變現效率。我們提出外賣多場景異構大圖、異構大圖在線建模技術演進路線，解決外賣搜索推薦業務多渠道、即時化的挑戰。相關成果發表CIKM2023會議一篇。聯合機器學習平臺搭建大規模圖訓練、

2024-03-29 21:16:38

24小時熱門文章

最新文章

最新評論文章