今天看爲了準備排隊論考試複習了下概率論,看到樣本的方差公式除數是n-1,對此很不解。因此查了一些資料並請教了一個學數學出身的朋友。
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
X表示樣本均值=(X1+X2+...+Xn)/n
以下是我的理解(感性的認識):
要求總體分佈的方差,而我們使用的是樣本。計算的是樣本值和樣本均值的距離。但是如果客觀來說,我們應該計算樣本值和u的距離。也就是說,我們用樣本值代表u是有一定誤差的。爲了減小這個誤差,我們使用了n-1.
百度知道的回答:
首先,用真正的(Xi-μ)^2來看,方差本應該是與μ的差,而不是樣本均值的差,增加一個數,就多一個(Xi-μ)^2,n個數據,這n個數據與μ是無關的,就該是n個這相加後除n。也就是自由度是n
但是,用樣本均值來減,從這來看X1+X2+...+Xn=nX,這個地方也就是說n個數據與X相關,這就少了一個自由度,從而,用(Xi-X)^2計算時,會相當少了一個原本(Xi-μ)^2。故除n-1。其實這講得也不太準確,我也不知道怎麼說好。
主要還是X1+X2+...+Xn=nX,這個計算出的X,Xi-X這所有相加爲0,也就是少了個了,少了什麼,我也不知怎麼說,自己想吧
驗證n-1的正確性
總體方差爲σ2
均值爲μ
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
X表示樣本均值=(X1+X2+...+Xn)/n
設A=(X1-X)^2+(X2-X)^2....+(Xn-X)^2
E(A)=E[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]
=E[(X1)^2-2X*X1+X^2+(X2)^2-2X*X2+X^2+(X2-X)^2....+(Xn)^2-2X*Xn+X^2]
=E[(X1)^2+(X2)^2...+(Xn)^2+nX^2-2X*(X1+X2+...+Xn)]
=E[(X1)^2+(X2)^2...+(Xn)^2+nX^2-2X*(nX)]
=E[(X1)^2+(X2)^2...+(Xn)^2-nX^2]
而
E(Xi)^2=D(Xi)+[E(Xi)]^2
=σ2+μ2 E(X)^2
=D(X)+[E(X)]^2
=σ2/n+μ2
所以
E(A)=E[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]
=n(σ2+μ2)-n(σ2/n+μ2)
=(n-1)σ2
所以爲了保證樣本方差的無偏性
S=[(X1-X)^2+(X2-X)^2....+(Xn-X)^2]/(n-1)
E(S)=(n-1)σ2/(n-1)=σ2