數理統計中樣本方差公式N-1的原因與奧妙

今天看爲了準備排隊論考試複習了下概率論,看到樣本的方差公式除數是n-1,對此很不解。因此查了一些資料並請教了一個學數學出身的朋友。

S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)

X表示樣本均值=(X1+X2+...+Xn)/n

 

以下是我的理解(感性的認識):

要求總體分佈的方差,而我們使用的是樣本。計算的是樣本值和樣本均值的距離。但是如果客觀來說,我們應該計算樣本值和u的距離。也就是說,我們用樣本值代表u是有一定誤差的。爲了減小這個誤差,我們使用了n-1.

 

 

 

百度知道的回答:

首先,用真正的(Xi-μ)^2來看,方差本應該是與μ的差,而不是樣本均值的差,增加一個數,就多一個(Xi-μ)^2,n個數據,這n個數據與μ是無關的,就該是n個這相加後除n。也就是自由度是n 

但是,用樣本均值來減,從這來看X1+X2+...+Xn=nX,這個地方也就是說n個數據與X相關,這就少了一個自由度,從而,用(Xi-X)^2計算時,會相當少了一個原本(Xi-μ)^2。故除n-1。其實這講得也不太準確,我也不知道怎麼說好。 

主要還是X1+X2+...+Xn=nX,這個計算出的X,Xi-X這所有相加爲0,也就是少了個了,少了什麼,我也不知怎麼說,自己想吧

 

 

 

驗證n-1的正確性

總體方差爲σ2

均值爲μ

S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)

X表示樣本均值=(X1+X2+...+Xn)/n

設A=(X1-X)^2+(X2-X)^2....+(Xn-X)^2

E(A)=E[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]

=E[(X1)^2-2X*X1+X^2+(X2)^2-2X*X2+X^2+(X2-X)^2....+(Xn)^2-2X*Xn+X^2]

=E[(X1)^2+(X2)^2...+(Xn)^2+nX^2-2X*(X1+X2+...+Xn)]

=E[(X1)^2+(X2)^2...+(Xn)^2+nX^2-2X*(nX)]

=E[(X1)^2+(X2)^2...+(Xn)^2-nX^2]

 

E(Xi)^2=D(Xi)+[E(Xi)]^2

=σ2+μ2 E(X)^2

=D(X)+[E(X)]^2

=σ2/n+μ2

 所以

E(A)=E[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]

=n(σ2+μ2)-n(σ2/n+μ2)

=(n-1)σ2

所以爲了保證樣本方差的無偏性

S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)

E(S)=(n-1)σ2/(n-1)=σ2

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章