對,https://blog.csdn.net/Hearthougan/article/details/77859173,的劃重點,以及解讀:
原文非常優秀,以下內容是我的重新理解,包含大量原文直接摘過來的內容。
無偏估計的意義是:在多次重複下,它們的平均數接近所估計的參數真值。
首先定義總體樣本是N(通常是不可全部獲得的,比如全世界人口的身高值)。抽樣樣本是x1,x2...xi。
設樣本均值爲,樣本方差爲,總體均值爲,總體方差爲,那麼樣本方差有如下公式:
爲什麼除n-1,而不是n。爲什麼n-1是無偏估計。
答:因爲樣本方差等價於,總體方差乘(1-1/n)。減去的部分(σ^2*1/n),實質上是抽樣過程方差,也就是每次的抽樣的樣本均值,與總體均值μ的方差。
過程:變換求解樣本方差的過程,得到,樣本方差(S^2)=總體方差(σ^2)-抽樣均值的方差(σ^2*1/n)
推導結果:
步驟一:
步驟二:
爲什麼var(X拔)=σ^2*1/n 。設X爲隨機變量,X1,X2,...Xi,...,Xn爲其n個樣本,DX爲方差。 根據方差的性質,有D(X+Y)=DX+DY,以及D(kX)=k^2*DX,其中X和Y相互獨立,k爲常數。 於是D(ΣXi/n)=ΣD(Xi)/(n^2)=DX/n