目錄
假設檢驗單的要素
- 原假設H0:這個假設會被接受,除非數據能夠提供可信的證據表明它是錯的,通常代表"現狀"或研究者希望驗證的一些關於總體參數對論斷
- 備選假設Ha:這個假設會被接受,當且僅當數據對事實對真心提供量可信對證據,通常是研究者希望取得證據來支持的總體參數的取值
- 檢驗統計量(z,t和 卡方X2):是一個樣本統計量,它利用樣本提供的信息計算得到,研究者用這個樣本統計量在原假設和備選假設之間作出選擇
- 顯著性水平(α):在α的概率上拒絕原假設
- p值:檢驗統計量能夠提供的在p的概率上拒絕原假設
- 結論
假設檢驗中的概率
- α=P(第I類錯誤的概率)=P(當H0正確時拒絕H0)
- β=P(第II類錯誤的概率)=P(當H0錯誤時接受H0),要計算β值,備選假設需要一個關於樣本統計量的具體數值
- 1-β=統計檢驗功效=P(當H0錯誤時拒絕H0)
假設檢驗的步驟
問題:一個穀物分裝機生成商想檢驗一種分裝機的運行情況,分裝機預計爲每盒裝入12盎司,生成商想通過檢驗發現對這個設定的偏離情況,要求從今天的生成線上隨機抽取100盒,確定是否每盒平均裝入12盎司,建設該研究的假設檢驗,令α=0.01。
1. 確定目標檢驗參數
問題陳述中的關鍵詞“平均“暗示目標參數是每合谷物的平均數量μ
2.確定原假設H0和備選假設Ha
因爲生成商希望檢查對μ=12兩個方向之一對偏離,即μ>12或μ<12,所以
3. 計算檢驗統計量
因爲樣本數是100(n>30),根據中心極限定理,不論總體裝入量分佈如何,100盒對平均裝入量對抽樣分佈近似於正態分佈,可以運用正態分佈來進行檢驗。計算出z分數,需要分別計算x_bar, σ≈s
計算出:z=-2.91
4. 根據顯著性水平α確定拒絕域
如α=0.01,由於備選假設是雙尾檢驗,因此每側都是α/2=0.005,對應拒絕域爲z<-2.576或z>2.576
5. 將檢驗統計量計算值與拒絕域進行比較,得出結論
由於z=-2.91處於z<-2.576的拒絕域,因此拒絕原假設,選擇備選假設Ha:μ!=12(μ>12或μ<12)
計算觀察對顯著性水平-p值,讓讀者自己判斷是否接受原假設
前述的假設檢驗過程,拒絕域和相應的α值是在檢驗之前選擇的,結論是拒絕或者不拒絕原假設。凌一個陳述統計檢驗結果的表達是:給出不同原假設的範圍,讓讀者來決定是否拒絕原假設。這個不認同的度量值陳爲檢驗觀測的顯著性水平(observed significance level)
查表計算p值的步驟
利用統計軟件進行檢驗,一般會給出檢驗的p值,可以用p值和置信水平α進行比較:
常用假設檢驗的類型
總體均值的假設檢驗:正態z統計量
2.大量樣本(n>=30), 根據中心極限定理,這個條件保證量無論總體分佈的形狀如何,統計量都是近似正態分佈的
總體均值的假設檢驗:學生t統計量(小樣本)
總體比例的假設檢驗
總體比例(百分比)的推斷經常在二項分佈的“成功“概率爲p的清晰下進行討論,比如確定某商品的次品概率是否小於5%,某節目青年觀衆的比例是否大於20%等等。
2. 樣本量n很大,滿足np>=15且nq>=15,其中q=1-p
總體方差的假設檢驗
主要是對某個變量對變異性檢驗,方差檢驗常常運用在質量控制,比如檢驗每瓶罐頭裝入量對標準差是否小於0.1 盎司。
方差檢驗運用統計量:(n-1)s^2/σ ^2,其中n爲樣本個數,s^2爲方差,σ ^2爲總體方差對假設值,如果總體符合正態分佈,統計量分佈符合卡方分佈(樣本方差的抽樣分佈)
假設檢驗運用的條件:
2. 樣本來自的總體服從近似正態分佈(卡方分佈對樣本大小不敏感,對總體是否正態分佈非常敏感)