Machine Learning（五—1）神經網絡初步

原創

2018-08-24 07:20

第四講——Neural Networks 神經網絡的表示

===============================

（一）、爲什麼引入神經網絡？——Nonlinear hypothesis

（二）、神經元與大腦（Neurons and Brain）

（三）、神經網絡的表示形式

（四）、怎樣用神經網絡實現邏輯表達式？

（五）、分類問題（Classification）

本章主要圍繞神經網絡的建模及其線性表示（即neural networks的representation）做以初步瞭解，在下一章中將會有更詳細的神經網絡如何學習方面的知識。

===============================

（一）、爲什麼引入神經網絡？——Nonlinear hypothesis

之前我們討論的ML問題中，主要針對Regression做了分析，其中採用梯度下降法進行參數更新。然而其可行性基於假設參數不多，如果參數多起來了怎麼辦呢？比如下圖中這個例子：從100*100個pixels中選出所有XiXj作爲logistic regression的一個參數，那麼總共就有5*10^7個feature，即x有這麼多維。

所以引入了Nonlinear hypothesis，應對高維數據和非線性的hypothesis（如下圖所示）：

===============================

（二）、神經元與大腦（neurons and brain）

神經元工作模式：

神經網絡的邏輯單元：輸入向量x（input layer），中間層a(2,i)（hidden layer）, 輸出層h(x)（output layer）。

其中，中間層的a(2,i)中的2表示第二個級別（第一個級別是輸入層），i表示中間層的第幾個元素。或者可以說，a(j,i) is the activation of unit i in layer j.

===============================

（三）、神經網絡的表示形式

從圖中可知，中間層a(2，j)是輸入層線性組合的sigmod值，輸出又是中間層線性組合的sigmod值。

下面我們進行神經網絡參數計算的向量化：

令z⁽²⁾表示中間層，x表示輸入層，則有

，

z⁽²⁾=Θ⁽¹⁾x

a⁽²⁾=g(z⁽²⁾)

或者可以將x表示成a⁽¹⁾，那麼對於輸入層a⁽¹⁾有[x_0~x_3]4個元素，中間層a⁽²⁾有[a⁽²⁾₀~a⁽²⁾₃]4個元素（其中令a⁽²⁾₀=1），則有

h(x)= a⁽³⁾=g(z⁽³⁾)

z⁽³⁾=Θ⁽²⁾a⁽²⁾

通過以上這種神經元的傳遞方式（input->activation->output）來計算h(x), 叫做Forward propagation, 向前傳遞。

這裏我們可以發現，其實神經網絡就像是logistic regression，只不過我們把logistic regression中的輸入向量[x₁~x₃]變成了中間層的[a⁽²⁾₁~a⁽²⁾₃], 即

h(x)=g(Θ⁽²⁾₀ a⁽²⁾₀+Θ⁽²⁾₁ a⁽²⁾₁+Θ⁽²⁾₂ a⁽²⁾₂+Θ⁽²⁾₃ a⁽²⁾₃)

而中間層又由真正的輸入向量通過Θ⁽¹⁾學習而來，這裏呢，就解放了輸入層，換言之輸入層可以是original input data的任何線性組合甚至是多項式組合如set x1*x2 as original x1...另外呢，具體怎樣利用中間層進行更新下面會更詳細地講；此外，還有一些其他模型，比如：

===============================

（四）、怎樣用神經網絡實現邏輯表達式？

神經網路中，單層神經元（無中間層）的計算可用來表示邏輯運算，比如邏輯AND、邏輯或OR

舉例說明：邏輯與AND；下圖中左半部分是神經網絡的設計與output層表達式，右邊上部分是sigmod函數，下半部分是真值表。

給定神經網絡的權值就可以根據真值表判斷該函數的作用。再給出一個邏輯或的例子，如下圖所示：

以上兩個例子只是單層傳遞，下面我們再給出一個更復雜的例子，用來實現邏輯表達< x1 XNOR x2 >, 即邏輯同或關係，它由前面幾個例子共同實現：

將AND、NOT AND和 OR分別放在下圖中輸入層和輸出層的位置，即可得到x1 XNOR x2，道理顯而易見：

a²₁ = x1 && x2

a²₂ = （﹁x1）&&（﹁x2）

a³₁ =a²₁||a²₁ =(x1 && x2) || （﹁x1）&&（﹁x2） = x1 XNOR x2；

應用：手寫識別系統

===============================

（五）、分類問題（Classification）

記得上一章中我們講過的one-vs-all分類問題麼？one-vs-all方法是把二類分類問題到多類分類的一個推廣，在這裏，我們就講述如何用神經網絡進行分類。網絡設計如下圖所示：

輸入向量x有三個維度，兩個中間層，輸出層4個神經元分別用來表示4類，也就是每一個數據在輸出層都會出現[a b c d]^T，且a,b,c,d中僅有一個爲1，表示當前類。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

相關文章

「機器學習_8」Bag-of-Words

Bag-of-Words 1.文字問題 2. 什麼是Bag-of-Words(具體例子） 3. 侷限性 1.文字問題文本建模的一個問題是它很雜亂，機器學習算法之類的技術更喜歡定義明確的

2020-07-08 11:01:54

迴歸損失函數：L1 Loss, L2 Loss, Smooth L1 Loss

講解的很清楚： https://www.cnblogs.com/wangguchangqing/p/12021638.html

2020-07-08 10:39:04

感知機中的關鍵問題：點到平面的距離，和梯度更新的符號

感知機的原理、以及學習方法，還是比較簡單的，參考： https://www.pkudodo.com/2018/11/18/1-4/ 但其中有2點關鍵，不是特別好理解： 1、關於點到平面的距離：參考：https://www.jian

2020-07-08 10:27:04

變身漫畫道具玩了沒？這樣的 AI 人像特效機器學習服務幫你實現

近期，抖音上一款 “變身漫畫” 的特效刷爆“我的關注”，二次元漫畫樣式的畫風更是讓大家欲罷不能。從明星到路人，從大朋友到小朋友紛紛參與其中，抖音 App 中“變身漫畫”話題頁顯示約有 1851 萬餘人使用該道具。如今，此類視頻 / 圖片

2020-07-14 12:03:51

深度學習_目標檢測_FPN論文詳解

FPN的創新點多層特徵特徵融合解決了目標檢測中的多尺度問題，通過簡單的網絡連接改變，在基本不增加原有模型計算量的情況下，大幅度提升小物體（small object）的檢測性能。在物體檢測裏面，有限計算量情況下，網絡的深

2020-07-08 11:57:07

深度學習_目標檢測_“YOLOv5”詳解（持續更新）

YOLOv5可以方便的進行工程化部署： YOLOv5（PyTorch）−>ONNX−>CoreML−>iosYOLOv5（PyTorch） -> ONNX -> CoreML -> iosYOLOv5（PyTorch）−>ONNX

2020-07-08 11:57:07

分類問題中的決策面畫法 (直觀理解plt.contour的用法)

摘要通過分類問題中決策面的繪製過程直觀理解matplotlib中contour的用法，主要包括對 np.meshgrid 和plt.contour的直觀理解。前言分類問題中，我們習慣用2維的dmeo做例子，驗證算法的有效性。

张王李刘赵孙杨

2020-07-08 11:10:55

KNN算法第二章 Pandas & sklearn 機器學習實戰 Machine Learning in action

本專欄計劃藉助Pandas與sklearn重新實現書中的實戰案例。 k-近鄰算法1. KNN算法流程2. KNN改進約會網站的配對效果2.1 數據準備：從文本中解析數據2.2 數據可視化：散點圖2.3 數據處理：歸一化數值2.4

2020-07-08 11:09:44

[R]聚類算法:k-means模組

延伸<[Excel]k-means聚類算法的應用，以評價現有供應商的水平為例。>文章，同時恰巧在圖書館看到一本R語言機器學習書籍，因此正好可進一步瞭解如何用R語言來實現k-means算法和應用，一併將k-means模組建立起來，做為未來參

2020-07-08 10:38:53

python--內置函數

1、python內置函數：類型轉換數學運算常用 int() max() all() range() help() float() min() any() set() format() long() sum() type()

2020-07-08 10:38:40

吳恩達機器學習課程思維導圖

Github上黃博整理的吳恩達機器學習課程的資料，用xmind轉化成思維導圖，方便查看和記憶。參考自：https://github.com/fengdu78/Coursera-ML-AndrewNg-Notes

2020-07-08 09:20:14

機器學習筆記(七)--理解batch_dot函數

在keras中有batch_dot函數，用於計算兩個多維矩陣，官方註釋如下： def batch_dot(x, y, axes=None): """Batchwise dot product. `batch_dot`

2020-07-08 09:20:14

置信學習：讓樣本中的“髒數據“原形畢露

在實際工作中，你是否遇到過這樣一個問題或痛點：無論是通過哪種方式獲取的標註數據，數據標註質量可能不過關，存在一些錯誤？亦或者是數據標註的標準不統一、存在一些歧義？特別是badcase反饋回來，發現訓練集標註的居然和badcase一樣？如下

2020-07-08 09:16:27

simple faster rcnn解讀一

一:代碼框架和跑通simple faster rcnn遇到的問題代碼選擇：https://github.com/chenyuntc/simple-faster-rcnn-pytorch；本文主要是自己將代碼跑通中遇到的問題以及代碼解讀

2020-07-08 09:02:08

決策樹python實現（ID3 和 C4.5）

最近在看機器學習實戰，記錄一些不寫代碼，真的很難發現的問題。 ID3代碼見github ID3的問題： 1、從信息增益的計算方法來看，信息增益無法直接處理連續取值的的屬性數據，只能處理離散型的數據。 2、信息增益的計算方法需要對某

2020-07-08 08:32:14

24小時熱門文章

最新文章

最新評論文章