《統計學:從數據到結論》學習筆記(part3)--任何統計量,只要人們覺得合適就可以當成估計量

學習筆記
學習書籍:《統計學:從數據到結論》-吳喜之;
參考書目:《統計學》-賈俊平


用估計量估計總體參數

我們都知道樣本的函數稱之爲統計量,而用於估計的統計量則被稱爲估計量。由於統計量對於不同的樣本取值不同,所以估計量就是隨機變量,並有其分佈。如果樣本已經得到,把數據帶入後,估計量就有了一個數值,也就不是隨機的了,這個數值就是該估計量的一個實現或取值,也稱爲一個估計值。

點估計和區間估計

這裏介紹兩種估計,一種是點估計,也就是用估計量的實現值來近似相應的總體參數。另一種是區間估計,它是包括估計量在內的一個區間,該區間很有可能包含總體參數。

點估計

任何統計量,只要人們覺得合適就可以當成估計量。我們知道的最常用的估計量就是:樣本均值、樣本標準差等。

那麼什麼是好估計量的標準呢?一種統計量稱爲無偏估計量。所謂無偏性,就是:雖然每個樣本產生的估計量的取值不一定等於參數,但當抽取大量樣本時,那些樣本產生的估計量的均值會接近真正要估計的假定分佈的參數。嚴格來說,如果估計量的數學期望等於欲估計的總體參數,則該估計量稱爲該參數的無偏估計量。因此,無偏性僅僅是非常多次重複抽樣時的一個漸進概念。在無偏估計量中,人們還希望找尋方差最小的估計量,稱爲最小方差無偏估計量,方差小則說明反覆抽樣產生的許多估計值差別不大,因此更加精確。

區間估計

當描述一個人的身高時,我們不會說,某人高180.2cm,而可能會說,某人身高在175 ~ 185之間,這時,我們提供的這個範圍就是某種區間估計。在抽樣調查中,我們也常用到點估計加區間估計的說法。比如:某人的支持率爲80%,誤差爲±4\pm 4 %,置信度爲95%.

這種說法意味着:支持率爲80%是樣本比例作爲總體比例pp的點估計; 估計範圍在80%±4\pm 4%,即區間爲(76%, 84%); 如果以類似的方式,重複大量抽取樣本,產生的大量區間中,有些會覆蓋真正的總體比例pp,而有些則不會,但這些區間中大約有95%會覆蓋真正的總體比例。

這樣得到的區間,被稱爲總體比例pp的置信度爲95%的置信區間,這裏的置信度又稱爲置信水平或置信係數。顯然,置信度又是一個大量重複抽樣時的漸進概念。

在這裏,我們得到的區間(76%, 84%)是固定的,而總體比例pp也是固定的,只不過未知而已。因此只有兩種可能,要麼這個區間包含總體比例pp,要麼不總體比例pp,這當中沒有概率可言。

事實上,置信區間都是由統計量來確定的,依樣本而變,是隨機變量。因此,可以說,構造置信度爲100*(1-α\alpha)%的隨機區間,以1-α\alpha的概率覆蓋待估參數,但該區間相應於一個樣本的實現值,就是固定的了,無法知道其是否真正覆蓋需要估計的參數。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章