爲什麼樣本方差的分母爲n-1而不是n?

樣本方差與樣本均值,都是隨機變量,都有自己的分佈,也都可能有自己的期望與方差(由此進一步討論估計量的無偏性與有效性)。取分母n-1,可使樣本方差的期望等於總體方差,即這種定義的樣本方差是總體方差的無偏估計。
這樣看,x1,x2,...xn是n個可以自由變化的樣本,互不影響。
而x1-xbar, x2-xbar,...xn-xbar是否也是n個自由變化的呢?不是……因爲這n個統計量受到一個約束條件的影響就是之和等於0。如果我們記 yi=xi-xbar,也就是說y1+y2+...yn=0,這樣我們可以任意變動其中n-1值,比如取定了y1,y2,...y(n-1),那麼yn就不能任意變化,yn=-(y1+y2+y(n-1))。
這個只是從自由變化的角度直觀解釋,實際上證明分佈比較煩瑣……
舉個例子:
比如說讓十跟人任意取十個數,很容易理解可以隨便取.十個都是自由的.
如果我加一個條件,十個人取十個數,但是這是個書加起來必須得零.第一個人可以隨便取,第二個人也可以,第九個也可以,都是自由的,但是第十個人不能隨便自由取,只能取特定的數,才能保證這十個數的和是零.所以加了一個條件就丟了一個自由度
由於有一個約束條件,所以最後一個變量不能隨便取。爲了滿足這個約束條件,第n個變量不能隨機取值,它的值由前n-1個變量確定了。問題是:雖然第n個變量不能隨機取,假設取10以滿足約束條件,但10與均值的離差仍然存在。分子中,包括了這個離差平方,但分母卻不考慮它。
是不是可以這樣理解:按照方差的“定義”,分母仍應取n。只是爲了保證無偏性,對樣本方差進行調整。通過計算,分母應當取n-1。這時的方差實際是“調整後的樣本方差”,只不過我們仍將它叫做“樣本方差”。
用樣本去估計總體,當然就要評估估計的好壞如何。第一個評估方面就是先要評估這個估計是有偏估計還是無偏估計,無偏估計更爲有效。除以n所得到的樣本方差雖然也是總體方差的估計量,但是不是無偏估計量,而除以n-1所得到的樣本標準方差則是無偏估計量。正因爲除以n-1所得到的樣本標準方差是總體的無偏估計,所以它更科學點,誤差小些。之所以選擇n-1,不是巧合,而是數學推導下的結果。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章