無偏估計

先來給出一個公理:樣本均值的期望等於總體均值。


舉個例子吧:
現在甲市有一萬名小學三年級學生,他們進行了一次統考,考試成績服從1~100的均勻分佈:00001號學生得1分,00002號學生得1.01分……10000號學生得100分。那麼他們的平均分是多少?(1+1.01+1.02+....+100)/10000=50.5,這個值叫做總體平均數

現在假定你是教委的一個基層人員,教委主任給你一個早上時間,讓你估算一下全市學生的平均成績,你怎麼辦?把全市一萬名學生都問一遍再計算時間顯然是來不及了,因此在有限的時間裏,你找到了一個聰明的辦法:給全市的78所小學每一所學校打了一個電話,讓他們隨機選取一名學生的成績報上來,這樣你就得到了78個學生的成績,這78個學生就是你的樣本

你現在的任務很簡單了,拿這78個學生的成績相加併除以78,你就得到了樣本平均數。你把這個數報告給教委主任,這個數就是你估算出來的全市平均成績。

這個樣本平均數會不會等於總體平均數50.5?很顯然這和你的“手氣”有關——不過大多數情況下是不會相等的。

那麼問題來了:既然樣本平均數不等於總體平均數(也就是說你報給教委主任的平均分和實際的平均分非常有可能是不一樣的),要它還有用嗎?有!因爲樣本平均數是總體平均數的無偏估計——也就是說只要你採用這種方法進行估算,估算的結果的期望值(你可以近似理解爲很多次估算結果的平均數)既不會大於真實的平均數,也不會小於之。換句話說:你這種估算方法沒有系統上的偏差,而產生誤差的原因只有一個:隨機因素(也就是你的手氣好壞造成的)。
********************************************************************************************************************
再說一個例子:
比如我要對某個學校一個年級的上千個學生估計他們的平均水平(真實值,上帝才知道的數字),那麼我決定抽樣來計算。

我抽出一個10個人的樣本,可以計算出一個均值。那麼如果我下次重新抽樣,抽到的10個人可能就不一樣了,那麼這個從樣本里面計算出來的均值可能就變了,對不對?

因爲這個均值是隨着我抽樣變化的,而我抽出哪10個人來計算這個數字是隨機的,那麼這個均值也是隨機的。但是這個均值也會服從一個規律(一個分佈),那就是如果我抽很多次樣本,計算出很多個這樣的均值,這麼多均值們的平均數應該接近上帝才知道的真實平均水平。

如果你能理解“樣本均值”其實也是一個隨機變量,那麼就可以理解爲這個隨機變量的期望是真實值,所以無偏(這是無偏的定義);而它又是一個隨機變量,只是估計而不精確地等於,所以是無偏估計量。



發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章