通用近似定理

原創

2020-06-07 15:48

In the mathematical theory of artificial neural networks, the universal approximation theorem states[1] that a feed-forward network with a single hidden layer containing a finite number of neurons can approximate continuous functions on compact subsets of $R^n$ , under mild assumptions on the activation function. The theorem thus states that simple neural networks can represent a wide variety of interesting functions when given appropriate parameters; however, it does not touch upon the algorithmic learnability of those parameters.

在維基百科上的解釋如下：
在人工神經網絡(ANN)的數學理論當中，假設激活函數足夠柔和的情況下，通用相似定理是指在神經元個數足夠的情況下和通過單層的前饋神經網絡能夠近似逼近任意一個在緊子集 $R^n$ 上的連續函數。

在這裏under mlid assumptions on the activation function裏面的mlid assumptions具體的含義不是很清楚。

此外，compact subsets of $R^n$ 表示在 $R^n$ 上的緊子集。

數學理論就是這個樣子，爲了解釋一個專業術語，要用兩個其他的專業術語，然後依次類推術語爆炸。爲了解釋通用近似定理。需要去了解
compact subsets 和 mlid assumptions

當然，我們大概瞭解一下通用近似定理表示的含義是什麼就可以了。孤豈欲卿治經爲數學博士邪？但當涉獵，能敲搬磚爾。

還好後面另外加了一句解釋：

通用近似定理表明，當給定通用的參數的時候，簡單的神經網絡可以表示各種各樣的有意思的函數。

通用近似定理告訴我們：採用簡單的神經網絡可以擬合任意連續函數(因爲不理解緊子集的意義，這裏我把緊子集去掉了。)

通用，表示神經網絡對於所有連續函數的通用性。
近似，表示神經網絡採用高度逼近的學習方法擬合得到連續函數的表示。

遺留問題：
通用近似定理爲什麼在理論上具有通用性？
竟然通用近似定理是在理論上具有通用性，那實際上肯定是不具備通用性的，爲什麼在實際情況中不具備通用性？

在人工神經網絡之上所做出的其他的優化所解決的問題是什麼？比如卷積神經網絡，再比如attention。

參考資料:
通用近似定理
 nlp中的Attention注意力機制+Transformer詳解

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

通用近似定理

[轉帖]使用NMT和pmap解決JVM資源泄漏問題原創

Python實現大麥網搶票的四大關鍵技術點解析

Python 安裝庫指令大全

salesforce零基礎學習（一百三十八）零碎知識點小總結（十）

一款開源的.NET程序集反編譯、編輯和調試神器

關於接口協議，你必須要知道這些！

基於 Milvus + LlamaIndex 實現高級 RAG

【2024-05-21】以茶會友

大規模向量相似度計算(二)——hnswlib的參數含義

我寫的文章突然上了CSDN的熱榜

一天天神神叨叨的

大規模向量相似度計算(一)——hnswlib的基本使用示例

神奇的成功學法門

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結