顯著性水平 P值 概念解釋

P是“拒絕原假設時犯錯誤概率”又或者說是如果你拒絕掉原假設實際上是在冤枉好人的概率

不管怎麼表達理解上都有點繞,所以你還是看例子吧。比如你做一個假設( null hypothesis):你的女性朋友平均身高2米,輸入你統計的樣本數據後,計算機給你返回的p值是0.03。這意味着如果你拒絕“女性朋友平均身高2米”這個結論,犯錯的概率是0.03,小於0.05(人們一般認爲拒絕一句話時犯錯概率小於0.05就可以放心大膽地拒絕了),這個時候你就可以拒絕原假設。如果計算機返回p值是0.9,那麼你就會想,這說明拒絕原假設犯錯概率高達90%,那麼我就不應該拒絕原假設,即你應該認爲你的女性朋友平均身高就是2米。

至於什麼是alpha呢,上面例子中0.05這個標準就是alpha值,這個標準是可以你自己人爲改變的


原假設爲女性朋友身高平均值2米,取了若干個樣本後測量出樣本的平均值爲1.6,經過計算(計算過程非常簡單,如果總體的方差已知就用Z檢驗,如果總體的方差未知就用樣本方差替代然後用t檢驗,每本統計書上都有不贅述),在我們設定alpha爲0.05時,置信區間爲1.8到2.2,咱們取的樣本均值1.6不在這個範圍內,所以拒絕

“拒絕原假設犯錯的概率”是在說什麼呢,它是在說,我們假設女孩子們身高均值爲2米,計算出來的均值爲1.6,跟原假設差距很大,這時候我們拒絕原假設“身高爲2米”,我們拒絕這個不靠譜假設時可能犯錯的概率<=0.05。

“接受原假設正確的概率”是在說什麼呢,它是在說,我們假設女孩子們身高均值爲2米,計算出來的均值爲1.6,跟原假設差距很大,但我們還是堅持認爲原假設“身高爲2米,我們堅持這個不靠譜假設時可能正確的概率<=0.05。

看到這裏應該所有人都能明白了,“拒絕不靠譜原假設時犯錯的概率”跟“接受不靠譜原假設時正確的概率”是一致的。講過例子之後可以發現,在原話中加上“不靠譜”三個字,有助於我們的理解。

樣本均值1.6對應的p值爲0.03是什麼意思?這是指,在假設全體女孩身高爲2米的情況下,咱們隨機抽取到一些樣本得出均值爲1.6米或比1.6米更極端的數值的可能性爲0.03,在原假設下抽到這樣樣本的概率太低了,而我們卻十分稀罕地居然一下就抽到了這樣的樣本,那麼正常人的第一反應就是,咱們原先假設身高均值爲2米這個假設不對。用統計學的話來說就叫做“由於樣本均值落在拒絕域中,所以拒絕原假設”。

可見,p值是在精確的算出一個取樣的稀罕程度。alpha值是事先給出了一個對樣本稀罕程度的判斷,這個值是可以主觀去改變的,你可以認爲取到樣本均值的可能性爲0.2或更低就很極端從而拒絕,也可以認爲取到樣本均值的可能性爲0.001或更低才拒絕。一般認爲樣本稀罕到可能取到的概率<=0.05時,咱們就認爲原假設不靠譜。





發佈了148 篇原創文章 · 獲贊 277 · 訪問量 114萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章