神經網絡隱含層的物理意義

原創

2019-07-19 13:35

softmax迴歸與多層神經網絡模型

softmax迴歸與多層神經網絡都可以實現多分類器，兩種分類器的模型如下圖所示：

softmax迴歸

多層神經網絡

物理意義

根據圖示我們可以看到，多層神經網絡模型與迴歸模型，在原理上是相似的，都是構造線性模型，多層神經網絡只是在輸入層與輸出層之間添加了n個隱含層(n>=1)，添加隱含層的物理意義是什麼呢？

無論是softmax模型，還是多層神經網絡模型，都是構造線性模型，但是當輸入數據不是線性可分的，模型該怎麼預測結果呢？

線性可分數據，構造一個線性二分器即可把數據分開

線性不可分數據，需要構造多個二分類器對數據進行分類

多層神經網絡，可以認爲將原始輸入數據，在每一層隱含層上做了多個二分類，二分類的個數即爲該隱含層的神經元個數。如上圖所示，輸入數據的維度是2，即：x1和x2，對於此線性不可分的數據，可以做3個二分類器，即：y1、y2和y3，所以隱含層中有3個神經元。因此，對於線性不可分的數據來說，多層神經網絡比softmax迴歸效果理論上要好。

對於高維的數據，我們很難進行可視化，所以隱含層的層數以及每層中神經元的個數，只能通過多次訓練調整。

上面解釋了爲什麼多層神經網絡有多個隱含層。

另外，可以參考MIT deep learning的書籍，中間有一部分解釋的也很清楚，就是爲了讓線性不可分的數據變得線性可分：

作者：前進的小白
來源：CSDN
原文：https://blog.csdn.net/qq_22690765/article/details/75050943
版權聲明：本文爲博主原創文章，轉載請附上博文鏈接！

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

神經網絡隱含層的物理意義

softmax迴歸與多層神經網絡模型

softmax迴歸

多層神經網絡

物理意義

線性不可分數據，需要構造多個二分類器對數據進行分類

「Pygors跨平臺GUI」1：Pygors跨平臺GUI應用研究

[轉帖]

python列出centos7內存使用前50的進程信息

「Pygors跨平臺GUI」2：安裝MinGW-w64、MSYS2還是WSL2

一鍵自動化博客發佈工具,用過的人都說好(掘金篇)

通義千問 2.5 “客串” ChatGPT4，你分的清嗎？

Garnet：微軟官方基於.NET開源的高性能分佈式緩存存儲數據庫

Flink執行圖

Java響應式編程

評估統計算法在銀行僞造鈔票檢測中的價值

使用自定義積木增強Scratch無限循環積木功能

Scratch編程技巧之「停止腳本執行」積木用法

Scratch中間接實現多維數組支持（一）

Scratch 3.10.2新版本簡介

Cocos2d-x 4.0初裝（MAC平臺）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結