基於單樣本單統計推斷-假設檢驗

目錄

假設檢驗單的要素

假設檢驗中的概率

假設檢驗的步驟

1. 確定目標檢驗參數

2.確定原假設H0和備選假設Ha

3. 計算檢驗統計量

4. 根據顯著性水平α確定拒絕域

5. 將檢驗統計量計算值與拒絕域進行比較,得出結論

計算觀察對顯著性水平-p值,讓讀者自己判斷是否接受原假設

查表計算p值的步驟

常用假設檢驗的類型

總體均值的假設檢驗:正態z統計量

總體均值的假設檢驗:學生t統計量(小樣本)

總體比例的假設檢驗

總體方差的假設檢驗

 

假設檢驗單的要素

  1. 原假設H0:這個假設會被接受,除非數據能夠提供可信的證據表明它是錯的,通常代表"現狀"或研究者希望驗證的一些關於總體參數對論斷
  2. 備選假設Ha:這個假設會被接受,當且僅當數據對事實對真心提供量可信對證據,通常是研究者希望取得證據來支持的總體參數的取值
  3. 檢驗統計量(z,t和 卡方X2):是一個樣本統計量,它利用樣本提供的信息計算得到,研究者用這個樣本統計量在原假設和備選假設之間作出選擇
  4. 顯著性水平(α):在α的概率上拒絕原假設
  5. p值:檢驗統計量能夠提供的在p的概率上拒絕原假設
  6. 結論

假設檢驗中的概率

  1. α=P(第I類錯誤的概率)=P(當H0正確時拒絕H0)
  2. β=P(第II類錯誤的概率)=P(當H0錯誤時接受H0),要計算β值,備選假設需要一個關於樣本統計量的具體數值
  3. 1-β=統計檢驗功效=P(當H0錯誤時拒絕H0)

假設檢驗的步驟

問題:一個穀物分裝機生成商想檢驗一種分裝機的運行情況,分裝機預計爲每盒裝入12盎司,生成商想通過檢驗發現對這個設定的偏離情況,要求從今天的生成線上隨機抽取100盒,確定是否每盒平均裝入12盎司,建設該研究的假設檢驗,令α=0.01。

1. 確定目標檢驗參數

問題陳述中的關鍵詞“平均“暗示目標參數是每合谷物的平均數量μ

2.確定原假設H0和備選假設Ha

因爲生成商希望檢查對μ=12兩個方向之一對偏離,即μ>12或μ<12,所以

H0:μ=12(總體平均裝入量是12盎司)

Ha:μ=12(μ>12或μ<12)

3. 計算檢驗統計量

因爲樣本數是100(n>30),根據中心極限定理,不論總體裝入量分佈如何,100盒對平均裝入量對抽樣分佈近似於正態分佈,可以運用正態分佈來進行檢驗。計算出z分數,需要分別計算x_bar, σ≈s

計算出:z=-2.91

4. 根據顯著性水平α確定拒絕域

如α=0.01,由於備選假設是雙尾檢驗,因此每側都是α/2=0.005,對應拒絕域爲z<-2.576或z>2.576

5. 將檢驗統計量計算值與拒絕域進行比較,得出結論

由於z=-2.91處於z<-2.576的拒絕域,因此拒絕原假設,選擇備選假設Ha:μ=12(μ>12或μ<12)

計算觀察對顯著性水平-p值,讓讀者自己判斷是否接受原假設

前述的假設檢驗過程,拒絕域和相應的α值是在檢驗之前選擇的,結論是拒絕或者不拒絕原假設。凌一個陳述統計檢驗結果的表達是:給出不同原假設的範圍,讓讀者來決定是否拒絕原假設。這個不認同的度量值陳爲檢驗觀測的顯著性水平(observed significance level)

查表計算p值的步驟

1. 根據樣本數據,計算相應的統計量z值(或t值等)

2. 根據統計量z值,確定p值:

  • 如果檢驗是單側的,p值就是相對於z偏向備選假設方向的那塊區域面積。因此,如果備選假設的形式是>,則p值是z右側區域的面積,如果備選假設的形式是<,則p值是z左側區域的面積(見下圖)

  • 如果檢驗是雙側的,p值是超過z塊區域面積的2倍。因此,如果z是正的, 則p值是右側區域面積的2倍,如果z是負的, 則p值是左側區域面積的2倍(見下圖)

利用統計軟件進行檢驗,一般會給出檢驗的p值,可以用p值和置信水平α進行比較:

  1. 如果p<α,則拒絕H0,接受Ha
  2. 如果p>α,則接受H0

常用假設檢驗的類型

總體均值的假設檢驗:正態z統計量

假設檢驗運用的條件:

1.樣本是從目標總體中隨機抽取

2.大量樣本(n>=30), 根據中心極限定理,這個條件保證量無論總體分佈的形狀如何,統計量都是近似正態分佈的

以正態(z)統計量爲基礎的大樣本假設檢驗方法

總體均值的假設檢驗:學生t統計量(小樣本)

假設檢驗運用的條件:

1.樣本是從目標總體中隨機抽取

2. 一般爲小樣本(小於30),樣本的總體近似服從正態分佈

以t統計量爲基礎的大樣本假設檢驗方法

總體比例的假設檢驗

總體比例(百分比)的推斷經常在二項分佈的“成功“概率爲p的清晰下進行討論,比如確定某商品的次品概率是否小於5%,某節目青年觀衆的比例是否大於20%等等。

假設檢驗運用的條件:

1.樣本來自二項分佈中隨機抽取

2. 樣本量n很大,滿足np>=15且nq>=15,其中q=1-p

以p統計量爲基礎的大樣本假設檢驗方法

總體方差的假設檢驗

主要是對某個變量對變異性檢驗,方差檢驗常常運用在質量控制,比如檢驗每瓶罐頭裝入量對標準差是否小於0.1 盎司。

方差檢驗運用統計量:(n-1)s^2/σ ^2,其中n爲樣本個數,s^2爲方差,σ ^2爲總體方差對假設值,如果總體符合正態分佈,統計量分佈符合卡方分佈(樣本方差的抽樣分佈)

假設檢驗運用的條件:

1. 樣本從總體中隨機抽取

2. 樣本來自的總體服從近似正態分佈(卡方分佈對樣本大小不敏感,對總體是否正態分佈非常敏感)

以χ 統計量爲基礎的大樣本假設檢驗方法

 

 

 

 

 

 

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章