用样本均值代替总体均值,自由度会减1,所以分母是n-1。
严格的推导如下:
首先,我们先看看方差的计算公式
Var(X)=n∑i=1n(Xi−μ)2
其中μ
是这个总体的真实均值。但是往往μ是未知的,所以我们用样本均值Xˉ来代替μ,也就是
S∗=n∑i=1n(Xi−Xˉ)2
那么这个S∗
是正确的估计吗?我们可以计算S∗
的期望来对比一下Var(X)
。
E(S∗)=E(n∑i=1n(Xi−Xˉ)2)=E(n∑i=1n(Xi−μ+μ−Xˉ)2)=E(n∑i=1n(Xi−μ)2+n∑i=1n2(Xi−μ)(μ−Xˉ)+n∑i=1n(μ−Xˉ)2)=Var(X)+E(n∑i=1n2(Xi−μ)(μ−Xˉ)+n∑i=1n(μ−Xˉ)2)=Var(X)+E(−2(Xˉ−μ)2+(Xˉ−μ)2)=Var(X)−E((Xˉ−μ)2)=Var(X)−Var(Xˉ)=Var(X)−n1Var(X)=nn−1Var(X)
所以
Var(X)=n−1nE(S∗)=n−1∑i=1n(Xi−Xˉ)