徹底理解樣本方差爲何除以n-1

    設樣本均值爲,樣本方差爲,總體均值爲,總體方差爲,那麼樣本方差有如下公式:


    很多人可能都會有疑問,爲什麼要除以n-1,而不是n,但是翻閱資料,發現很多都是交代到,如果除以n,對樣本方差的估計不是無偏估計,比總體方差要小,要想是無偏估計就要調小分母,所以除以n-1,那麼問題來了,爲什麼不是除以n-2、n-3等等。所以在這裏徹底總結一下,首先交代一下無偏估計。

無偏估計

    以例子來說明,假如你想知道一所大學裏學生的平均身高是多少,一個大學好幾萬人,全部統計有點不現實,但是你可以先隨機挑選100個人,統計他們的身高,然後計算出他們的平均值,記爲。如果你只是把作爲整體的身高平均值,誤差肯定很大,因爲你再隨機挑選出100個人,身高平均值很可能就跟剛纔計算的不同,爲了使得統計結果更加精確,你需要多抽取幾次,然後分別計算出他們的平均值,分別記爲:然後在把這些平均值,再做平均,記爲:,這樣的結果肯定比只計算一次更加精確,隨着重複抽取的次數增多,這個期望值會越來越接近總體均值,如果滿足,這就是一個無偏估計,其中統計的樣本均值也是一個隨機變量,就是的一個取值無偏估計的意義是:在多次重複下,它們的平均數接近所估計的參數真值。

    介紹無偏估計的意義就是,我們計算的樣本方差,希望它是總體方差的一個無偏估計,那麼假如我們的樣本方差是如下形式:


那麼,我們根據無偏估計的定義可得:



    由上式可以看出如果除以n,那麼樣本方差比總體方差的值偏小,那麼該怎麼修正,使得樣本方差式總體方差的無偏估計呢?我們接着上式繼續化簡:


到這裏得到如下式子,看到了什麼?該怎修正似乎有點眉目。

    如果讓我們假設的樣本方差乘以,即修正成如下形式,是不是可以得到樣本方差是總體方差的無偏估計呢?


則:



    因此修正之後的樣本方差的期望是總體方差的一個無偏估計,這就是爲什麼分母爲何要除以n-1。


發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章