爲什麼樣本方差的分母爲n-1而不是n？

樣本方差與樣本均值，都是隨機變量，都有自己的分佈，也都可能有自己的期望與方差（由此進一步討論估計量的無偏性與有效性）。取分母n-1，可使樣本方差的期望等於總體方差，即這種定義的樣本方差是總體方差的無偏估計。
這樣看，x1,x2,...xn是n個可以自由變化的樣本，互不影響。
而x1-xbar, x2-xbar,...xn-xbar是否也是n個自由變化的呢？不是……因爲這n個統計量受到一個約束條件的影響就是之和等於0。如果我們記 yi=xi-xbar,也就是說y1+y2+...yn=0,這樣我們可以任意變動其中n－1值，比如取定了y1,y2,...y(n-1)，那麼yn就不能任意變化，yn=-(y1+y2+y(n-1))。
這個只是從自由變化的角度直觀解釋，實際上證明分佈比較煩瑣……
舉個例子：
比如說讓十跟人任意取十個數,很容易理解可以隨便取.十個都是自由的.
如果我加一個條件,十個人取十個數,但是這是個書加起來必須得零.第一個人可以隨便取,第二個人也可以,第九個也可以,都是自由的,但是第十個人不能隨便自由取,只能取特定的數,才能保證這十個數的和是零.所以加了一個條件就丟了一個自由度
由於有一個約束條件，所以最後一個變量不能隨便取。爲了滿足這個約束條件，第n個變量不能隨機取值，它的值由前n-1個變量確定了。問題是：雖然第n個變量不能隨機取，假設取10以滿足約束條件，但10與均值的離差仍然存在。分子中，包括了這個離差平方，但分母卻不考慮它。
是不是可以這樣理解：按照方差的“定義”，分母仍應取n。只是爲了保證無偏性，對樣本方差進行調整。通過計算，分母應當取n-1。這時的方差實際是“調整後的樣本方差”，只不過我們仍將它叫做“樣本方差”。
用樣本去估計總體，當然就要評估估計的好壞如何。第一個評估方面就是先要評估這個估計是有偏估計還是無偏估計，無偏估計更爲有效。除以n所得到的樣本方差雖然也是總體方差的估計量，但是不是無偏估計量，而除以n-1所得到的樣本標準方差則是無偏估計量。正因爲除以n-1所得到的樣本標準方差是總體的無偏估計，所以它更科學點，誤差小些。之所以選擇n-1，不是巧合，而是數學推導下的結果。

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

爲什麼樣本方差的分母爲n-1而不是n？

1.1 Linux中的抽象級別與層次

poj1742

coudeup 問題 D: 【寬搜入門】魔板

解決vscode中提示頭文件未配置好的問題

爲什麼樣本方差的分母爲n-1而不是n？

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結