機器學習之——神經網絡學習

原創

郭了个治浩

2020-02-23 09:51

很久沒更新博客了，這一次我們繼續之前的機器學習的課程，這一節我們討論機器學習裏面重要的一個算法——神經網絡(Nerual Network)的學習部分。

神經網絡的代價函數

首先我們要引入一些標記，以便在後面討論中使用：

我們回想一下，在邏輯迴歸(Logistic Regression)問題中，我們的代價函數(Cost Function)如下：

在邏輯迴歸中，我們只有一個輸出變量，又稱作標量(Scalar)，也只有一個因變量y，但是在神經網絡中，我們可以有很多輸出變量，我們的hø(x)是一個維度爲K的向量，並且我們訓練集中的因變量也是同樣維度的一個向量，因此我們的代價函數會比邏輯迴歸更加複雜一些，如下所示：

這個代價函數看起來複雜很多，但是背後的思想還是一樣的。我們希望能夠通過代價函數來觀察算法預測的結果與真實情況的誤差有多大，唯一不同的是，對於每一行特徵，我們都會給出K個預測，基本上我們可以利用循環，對每一行特徵都預測K個不同的結果，然後再利用循環在K個預測中選擇可能性最大的一個，將其與y中的實際數據進行對比。

歸一化的哪一項只是排除了每一層的ø0後，每一層的ø矩陣的和。最裏層的循環 j 循環所有的行(由si +1層的激活單元書決定)，循環 i 則循環所有的列，由該層(si 層)的激活單元數所決定。

反向傳播算法(Backpropagation Algorithm)

之前我們在計算神經網絡預測結果的時候，我們採用了一種正向傳播方法，我們從第一層開始正向一層一層進行計算，直到最後一層的hø(x)。

現在，爲了計算代價函數的偏導數：

我們需要採用一種反向傳播算法，也就是首先計算最後一層的誤差，然後再一層一層反向求出各層的誤差，直到倒數第二層。

我們用一個例子來說明反向傳播算法。

假設，我們的訓練集只有一個實例（x(1), y(1)），我們的神經網絡是一個四層的神經網絡，其中：K=4，SL=4，L=4

我們從最後一層的誤差開始計算，誤差是激活單元的預測（）與實際值（yk）之間的誤差（k=1:K）。我們用來表示誤差，則：

我們利用這個誤差值來計算前一層的誤差：

其中g'(Z(3))是S形函數的導數，g'(Z(3))=a(3).*(1-a(3))。而則是權重導致的誤差的和。

下一步是繼續計算第二層的誤差：

因爲第一層是輸入變量，不存在誤差。我們有了所有的誤差的表達式之後，便可以計算代價函數的偏導數了，假設λ=0，即我們不做任何歸一化處理時有：

重要的是清楚地知道上面式子中上下標的含義：

如果我們考慮歸一化處理，並且我們的訓練集是一個特徵矩陣而非向量。在上面的特殊情況中，我們需要計算每一層的誤差單元來計算代價函數的偏導數。在更爲一般的情況中，我們同樣需要計算每一層的誤差單元，但是我們需要爲整個訓練集計算誤差單元，此時的誤差單元也是一個矩陣，我們用來表示這個誤差矩陣。第 l 層的第 i 個激活單元收到第 j 個參數影響而導致的誤差。

我們的算法表示爲：

即首先使用正向傳播方法計算出每一層的激活單元，利用訓練集的結果與神經網絡預測的結果求出最後一層的誤差，然後利用該誤差運用反向傳播法計算出直至第二層的所有誤差。

在求出了之後，我們便可以計算代價函數的偏導數了，計算方法如下：

在Octave或者Matlab中，如果我們使用 fminuc 這樣的優化算法求解求出權重矩陣，我們需要將矩陣首先展開爲向量，再利用算法求出最優解後再重新轉換回矩陣。

假設我們有三個權重矩陣，theta1，theta2和theta3，尺寸分別爲10*11，10*11和1*11，下面的代碼可以實現這樣的轉換：

這一次我們討論到這裏，下一回我們繼續學習神經網絡的梯度檢驗(Gradient Checking)和隨機初始化(Random Initialization)。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

探索未知：風靡硅谷開發者的 Unstructured Data Meetup 即將登陸中國

“最硅谷”的 Unstructured Data Meetup 即將來襲！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 2025 年，全球數據總量中將有超過

2024-05-15 21:26:01

爲程序員和新手準備的 8 大 Python 工具

Python 是一種開源編程語言，用於 Web 編程、數據科學、人工智能和許多科學應用。學習 Python 使程序員能夠專注於解決問題，而不是專注於語法，其豐富的庫賦予它完成偉大任務所需的力量。 1) IDLE 安裝 Python 時

2024-05-14 01:06:43

我宣佈，這是我找到的史上AI最全論文體系！

在碎片化閱讀充斥眼球的時代，越來越少的人會去關注每篇論文背後的探索和思考。搞AI，不少人都進入一個誤區，那就是隻鑽研自己的代碼是否精進，而沒有注意提升自己的閱讀能力。實際上，一個專業的學術研究員或者AI研究員可能需要花費幾百個小

2024-05-13 21:33:50

探索未知：風靡硅谷開發者的 Unstructured Data Meetup 即將登陸中國l

“最硅谷”的 Unstructured Data Meetup 即將來襲！衆所周知，AI 三要素包括：算力、算法和數據。數據的價值愈發凸顯，而其中非結構化數據更是備受關注。IDC 預測，到 2025 年，全球數據總量中將有超過 80% 的

2024-05-13 21:25:35

攻擊者正在利用AI，對保險公司發起大規模欺詐

保險欺詐一直是保險行業面臨的重要挑戰之一，尤其隨着技術的進步，欺詐者也在不斷更新其手段，利用AI技術，包括生成式模型、機器學習和數據分析工具等欺騙保險公司，而AI技術的應用正成爲他們的新工具，使其犯罪行爲更加隱蔽和複雜，挑戰保險行業的防欺詐

2024-05-10 00:55:17

理論+實踐，帶你瞭解分佈式訓練

本文分享自華爲雲社區《大模型LLM之分佈式訓練》，作者：碼上開花_Lancer。隨着語言模型參數量和所需訓練數據量的急速增長，單個機器上有限的資源已無法滿足大語言模型訓練的要求。需要設計分佈式訓練（Distributed Trainin

2024-05-08 22:38:41

2024年DataOps趨勢預測：AI不會取代數據工程師

APM digest收集了多位行業專家對DataOps在2024的發展形勢及對IT和業務的影響的預測，這些技術最高管理者，包括Confluent技術戰略負責人Andrew Sellers的深刻洞見可能與你的感覺一致嗎？快來探討一下。數據可

2024-04-30 11:49:29

數字化轉型新篇章：企業通往智能化的新範式

早在十多年前，一些具有前瞻視野的企業以實現“數字化”爲目標啓動轉型實踐。但時至今日，可以說尚無幾家企業能夠在真正意義上實現“數字化”。在實現“數字化”的征途上，人們發現，努力愈進，彷彿終點愈遠。究其原因，還在於轉型一直落後於技術邊界的拓展

2024-04-29 21:22:20

Stable Diffusion中的embedding

Stable Diffusion中的embedding 嵌入，也稱爲文本反轉，是在 Stable Diffusion 中控制圖像樣式的另一種方法。在這篇文章中，我們將學習什麼是嵌入，在哪裏可以找到它們，以及如何使用它們。什麼是嵌入embe

2024-04-25 21:31:13

AI從入門到入門之手寫數字識別模型java方式Dense全連接神經網絡實現

前言：授人以魚不如授人以漁.先學會用，在學原理，在學創造，可能一輩子用不到這種能力，但是不能不具備這種能力。這篇文章主要是介紹算法入門Helloword之手寫圖片識別模型java中如何實現以及部分解釋。目前大家對於人工智能-機器學習-神經網

2024-04-19 23:17:21

Pinecone: 大模型時代的智能索引與搜索解決方案

隨着人工智能技術的飛速發展，大模型（Large Models）已成爲衆多領域的重要工具。無論是自然語言處理、圖像識別還是其他複雜任務，大模型都展現出了強大的性能。然而，隨着模型規模的不斷擴大，數據量的激增，如何有效地管理、索引和搜索這些模型

2024-04-19 11:29:43

軟件測試從自動化到智能化，大模型開始加入

隨着科技的飛速發展，軟件行業也在不斷地演進和創新。作爲軟件行業的關鍵環節之一，軟件測試行業也在經歷着前所未有的變革。從最初的手動測試，到自動化測試，再到如今的智能化測試，軟件測試行業正在經歷一場深刻的技術革命。在這場革命中，Testin雲測

2024-04-19 00:53:25

裁員了！別錯過2024年大數據工程師必備的10項技能

在當今快速發展的世界中，數據被視爲新的石油。隨着對數據驅動洞察的日益依賴，大數據工程師的角色比以往任何時候都更爲關鍵。這些專業人員在管理和優化組織內的數據操作中扮演着至關重要的角色。在本文中，我們將探索2024年大數據工程師必須具備的十

2024-04-16 11:00:53

DevOps已死？2024年的DevOps將如何發展

隨着我們進入2024年，DevOps也隨之發生變化。新興的技術、變化的需求和發展的方法正在重新定義有效實施DevOps實踐。 IDC預測顯示，未來五年，支持DevOps實踐的產品市場繼續保持健康且快速增長，2022年-2027年的複合年增長

2024-04-08 12:51:44

從模型到部署，教你如何用Python構建機器學習API服務

本文分享自華爲雲社區《Python構建機器學習API服務從模型到部署的完整指南》，作者：檸檬味擁抱。在當今數據驅動的世界中，機器學習模型在解決各種問題中扮演着重要角色。然而，將這些模型應用到實際問題中並與其他系統集成，往往需要構建API

2024-04-08 10:33:17

24小時熱門文章

最新文章

最新評論文章