統計學4

中心極限定理
中心極限定理是最基礎、意義最重大的概念之一。根據該定理,任意良好定義了均值和方差的分佈,不管該分佈是連續還是離散的,隨着樣本容量增大,所有樣本和或者樣本均值或者衆數極差等統計量都符合正態分佈

樣本均值的抽樣分佈
抽樣分佈來自於原分佈,這裏我們求的是樣本均值,由原分佈的樣本得到。
比如,下圖的離散概率分佈,可以看出不可能是正態分佈
這裏寫圖片描述
下面我們取該隨機變量的樣本,求其平均值,然後看其平均值的頻率。
假設樣本容量是4,第一次取樣{1 1 3 6},平均值爲2.75;第二次取樣{3 4 3 1},平均值爲2.75;第三次取樣{1 1 6 6},平均值爲3.5。我們要進行很多次抽樣,然後對每次的4個樣本值進行平均。將所有平均值畫到一個頻率分佈中,可以得到一個正態分佈,其均值μx¯ 和原分佈的均值μ 基本一樣。如果樣本容量增大,則正態分佈的均值不變,但標準差、峯度和偏度比原來更小了,更近似於正態分佈。因爲樣本容量n越大,越難取到概率低的樣本,所以樣本均值的分佈會更有可能趨近於原分佈的均值。比如每次取100萬個樣本值,此時的樣本均值是總體均值的很好估計,樣本均值μx¯ 都會落在靠總體均值μ 很近的地方。
這裏寫圖片描述

假設n=1,也就是一次抽取一個值,平均值也是它本身。這時不管進行多少次試驗,都不會像正態分佈,因爲永遠也取不到2和5。所以隨着n趨於 時,樣本均值的抽樣分佈趨於完美正態分佈。其實n=10或15已經很接近正態分佈了。
這裏寫圖片描述


其實樣本均值的抽樣分佈的方差σ2x¯ 與原分佈的方差σ2 之間的關係也有公式,即σ2x¯=σ2n 。這顯然取決於樣本容量的大小,樣本容量與樣本均值分佈的方差是反向關係。
樣本均值抽樣分佈的標準差σx¯ 通常稱作均值標準誤差。
這裏寫圖片描述
這裏寫圖片描述
n=16時,驗證σx¯ =9.3/4=2.325
n=25時,驗證σx¯ =9.3/5=1.86

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章