爲什麼在很多應用中常採用正態分佈/高斯分佈、中心極限定理

爲什麼在很多應用中常採用正態分佈/高斯分佈?

當我們由於缺乏關於某個實數上分佈的先驗知識而不知道該選擇怎麼樣的形式時,正態分佈是默認的比較好的選擇,有兩個原因:
一,我們想要建模的很多分佈的真實情況是比較接近正態分佈的。 中心極限定理說明很多獨立隨機變量的和近似服從正態分佈。
二,在具有相同方差的所有可能的概率分佈中,正態分佈在實數上具有最大的不確定性。 因此,我們可以認爲正態分佈是對模型加入的先驗知識量最少的分佈

補充中心極限定理:

客觀背景:在實際中有許多隨機變量,它們是由大量的相互獨立的隨機因素的綜合影響所形成的,而其中每一個別因素在總的影響中所起的作用都是微小的,這種隨機變量往往近似服從正態分佈。
這一事實,表明了正態分佈的重要性,及爲什麼實際應用中會常遇到正態分佈。另一方面,它提供了獨立同分布隨機變量之和的近似分佈,只要和式中加項的個數充分大,就可以不必考慮和式中的隨機變量服從什麼分佈,都可以採用正態分佈來近似。

常見的三個中心極限定理:
A、獨立同分布的中心極限定理:加了同分布
相互獨立同分布的隨機變量(Xi)之和:隨機變量(Z),Z服從正態分佈。Xi可以服從正態分佈,也可以服從二項分佈,等等。
相互獨立同分布的隨機變量(Xi,i=1,2,…)之和即大量相互獨立的隨機因素;
隨機變量X即綜合影響。
B、李雅普諾夫中心極限定理:
無論各個隨機變量Xi(i=1,2,…,n)服從什麼分佈,它們的和 當n很大時,Z就近似服從正態分佈。
這就是爲什麼實際應用中爲什麼經常遇到正態分佈的一個重要原因,說明了正態分佈的重要性。因爲,在很多問題中,所考慮的隨機變量可以表示成很多個獨立的隨機變量之和。即中心極限定理說明獨立隨機變量的和近似服從正態分佈(要求加項的個數充分大)。
Eg,在任意時刻,一個城市的用電量是大量用戶用電量的總和;一個物理實驗的測量誤差是許多觀察不到的、可加的微小誤差所合成的,這個測量誤差往往近似服從正態分佈。

三個要素:
變量Xi:
隨機、
相互獨立
相加(綜合/總的)
隨機變量Xi之和Z:Z=X1+X2+X3+… X~正態分佈。

C、棣(di)莫弗-拉普拉斯中心極限定理(A的特殊情況):
要求各個相互獨立的隨機變量Xi服從二項分佈。該定理說明了正態分佈是二項分佈的極限分佈。


這篇博文特別生動形象,推薦:
https://www.matongxue.com/madocs/589.html
數學研究者認爲正態分佈是一個經驗公式
文章裏用高爾頓釘板裝置,生動展示了正態分佈的產生過程:
彈珠往下滾時,撞到釘子就會隨機選擇往左走還是往右走;
一顆彈珠一路滾下來會多次選擇方向(很多顆釘子),所有彈珠掉下去後最終的分佈神奇地接近正態分佈的圖形。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章