(七) 假設檢驗
一個問題
一個以減肥爲主要目標的健美俱樂部聲稱,參加其訓練班至少可以使減肥者平均體重減重8.5kg以上。爲了驗證該宣稱是否可信,調查人員隨機抽取了10名參加者,得到他們的體重記錄如下表:
在 的顯著性水平下,調查結果是否支持該俱樂部的聲稱?
我們怎麼來回答這個問題呢?
考慮一下上面的表格,換一種表現形式如下(樣本差值計算表):
下面計算差值均值和差值標準差:
由此我們得到了結論:有證據表明該俱樂部的宣稱是可信的。
看了半天天書,這是什麼?這就需要從假設檢驗的基本思想開始了。
統計學語言用一個等式或不等式表示問題的原假設。
在這個問題中用表示原假設,就是:: ;那麼用 表示備擇假設。即如果原假設不成立,就要拒絕原假設,而需要在另一個假設中作出選擇,這個假設稱爲備擇假設。在這個例子中表示爲::。
原假設與備擇假設互斥,肯定原假設,意味着放棄備擇假設;否定原假設,意味着接受備擇假設。
是我們要檢驗的參數。
是顯著性檢驗水平,在這個問題中:
兩類錯誤 (錯誤和錯誤)
對於原假設提出的命題可以用原假設成立或者原假設不成立來表述。當然,我們是根據樣本提供的信息進行判斷的,也就是由部門來推斷總體。因而判斷有可能正確,也有可能不正確,也就是說,我們面臨着犯錯誤的可能。所犯的錯誤有兩種類型:
第一種錯誤類型:原假設爲真,卻被我們拒絕了,犯這種錯誤的概率用 表示,所以也稱爲 錯誤或者叫做棄真錯誤。
第二種錯誤類型:原假設爲假,卻沒有被我們拒絕,犯這種錯誤的概率用 表示,所以也稱爲 錯誤或者叫做取僞錯誤。
當原假設爲真,我們卻將其拒絕,犯這種錯誤的概率用 表示,那麼,當 爲真,我們卻沒有拒絕 ,則表明作出了正確的決策,其概率自然爲 ;當原假設爲僞,我們卻沒有拒絕,犯這種錯誤的概率用表示,那麼,當爲僞,我們拒絕,這也是正確的決策,其概率爲 。總結如下:
項目 | 沒有拒絕 | 拒絕 |
爲真 | (正確決策) | (棄真錯誤) |
爲僞 | (取僞錯誤) | (正確決策) |
在假設檢驗中,大家都在執行這樣一個原則,即首先控制犯 錯誤原則。
假設檢驗中犯兩類錯誤的圖示。
假設檢驗的步驟:
- 提出假設
- 確定適當的檢驗統計量
- 規定顯著性水平
- 計算檢驗統計量的值
- 作出統計決策
作出統計決策:
- 計算檢驗的統計量
- 根據給定的顯著性水平,查表得出相應的臨界值或, 或
- 將檢驗統計量的值與 水平的臨界值進行比較
- 得出接受或拒絕原假設的結論
左單側檢驗和右單側檢驗
左單側檢驗(下限檢驗)
右單側檢驗(上限檢驗)
雙側檢驗
假設檢驗
假設檢驗(Hypothesis Testing),又稱統計假設檢驗,是用來判斷樣本與樣本、樣本與總體的差異是由抽樣誤差引起還是本質差別造成的統計推斷方法。顯著性檢驗是假設檢驗中最常用的一種方法,也是一種最基本的統計推斷形式,其基本原理是先對總體的特徵做出某種假設,然後通過抽樣研究的統計推理,對此假設應該被拒絕還是接受做出推斷。
假設檢驗的基本思想是“小概率事件”原理,其統計推斷方法是帶有某種概率性質的反證法。小概率思想是指小概率事件在一次試驗中基本上不會發生。反證法思想是先提出檢驗假設,再用適當的統計方法,利用小概率原理,確定假設是否成立。即爲了檢驗一個假設是否正確,首先假定該假設正確,然後根據樣本對假設做出接受或拒絕的決策。如果樣本觀察值導致了“小概率事件”發生,就應拒絕假設,否則應接受假設 。
假設檢驗中所謂“小概率事件”,並非邏輯中的絕對矛盾,而是基於人們在實踐中廣泛採用的原則,即小概率事件在一次試驗中是幾乎不發生的,但概率小到什麼程度才能算作“小概率事件”,顯然,“小概率事件”的概率越小,否定原假設就越有說服力,常記這個概率值爲α(0<α<1),稱爲檢驗的顯著性水平。對於不同的問題,檢驗的顯著性水平α不一定相同,一般認爲,事件發生的概率小於0.1、0.05或0.01等,即“小概率事件” 。
常用的假設檢驗方法有Z檢驗、t檢驗、卡方檢驗、F檢驗等。
假設檢驗的基本原理
用t分佈、區間估計中區間事件的餘集是小概率事件和小概率原理,得出了檢驗統計量t的數值及拒絕域,在樣本有代表性時,用統計量t和拒絕域可得出檢驗的更好決策。該方法稱爲t檢驗使產品質量檢驗由大樣本被小樣本替代。
基本步驟
1、提出檢驗假設又稱無效假設,符號是;備擇假設的符號是。
:樣本與總體或樣本與樣本間的差異是由抽樣誤差引起的;
:樣本與總體或樣本與樣本間存在本質差異;
預先設定的檢驗水準爲0.05;當檢驗假設爲真,但被錯誤地拒絕的概率,記作α,通常取α=0.05或α=0.01。
2、選定統計方法,由樣本觀察值按相應的公式計算出統計量的大小,如X2值、t值等。根據資料的類型和特點,可分別選用Z檢驗,T檢驗,秩和檢驗和卡方檢驗等。
3、根據統計量的大小及其分佈確定檢驗假設成立的可能性P的大小並判斷結果。若P>α,結論爲按α所取水準不顯著,不拒絕,即認爲差別很可能是由於抽樣誤差造成的,在統計上不成立;
如果P≤α,結論爲按所取α水準顯著,拒絕,接受,則認爲此差別不大可能僅由抽樣誤差所致,很可能是實驗因素不同造成的,故在統計上成立。P值的大小一般可通過查閱相應的界值表得到。
需要注意的問題:
- 作假設檢驗之前,應注意資料本身是否有可比性。
- 當差別有統計學意義時應注意這樣的差別在實際應用中有無意義。
- 根據資料類型和特點選用正確的假設檢驗方法。
- 根據專業及經驗確定是選用單側檢驗還是雙側檢驗。
- 判斷結論時不能絕對化,應注意無論接受或拒絕檢驗假設,都有判斷錯誤的可能性。
更多的 參數估計和假設檢驗的計算題,請點擊我的另外一篇博文:https://blog.csdn.net/seagal890/article/details/105757800