基於單樣本單統計推斷-假設檢驗

原創

毛飞龙

2020-04-20 09:57

5. 將檢驗統計量計算值與拒絕域進行比較，得出結論

計算觀察對顯著性水平-p值，讓讀者自己判斷是否接受原假設

查表計算p值的步驟

常用假設檢驗的類型

總體均值的假設檢驗：正態z統計量

總體均值的假設檢驗：學生t統計量（小樣本）

總體比例的假設檢驗

總體方差的假設檢驗

假設檢驗單的要素

原假設H0：這個假設會被接受，除非數據能夠提供可信的證據表明它是錯的，通常代表"現狀"或研究者希望驗證的一些關於總體參數對論斷
備選假設Ha：這個假設會被接受，當且僅當數據對事實對真心提供量可信對證據，通常是研究者希望取得證據來支持的總體參數的取值
檢驗統計量（z，t和卡方X2）：是一個樣本統計量，它利用樣本提供的信息計算得到，研究者用這個樣本統計量在原假設和備選假設之間作出選擇
顯著性水平（α）：在α的概率上拒絕原假設
p值：檢驗統計量能夠提供的在p的概率上拒絕原假設
結論

假設檢驗中的概率

α=P(第I類錯誤的概率)=P(當H0正確時拒絕H0)
β=P(第II類錯誤的概率)=P(當H0錯誤時接受H0)，要計算β值，備選假設需要一個關於樣本統計量的具體數值
1-β=統計檢驗功效=P(當H0錯誤時拒絕H0)

假設檢驗的步驟

問題：一個穀物分裝機生成商想檢驗一種分裝機的運行情況，分裝機預計爲每盒裝入12盎司，生成商想通過檢驗發現對這個設定的偏離情況，要求從今天的生成線上隨機抽取100盒，確定是否每盒平均裝入12盎司，建設該研究的假設檢驗，令α=0.01。

1. 確定目標檢驗參數

問題陳述中的關鍵詞“平均“暗示目標參數是每合谷物的平均數量μ

2.確定原假設H0和備選假設Ha

因爲生成商希望檢查對μ=12兩個方向之一對偏離，即μ>12或μ<12，所以

H0：μ=12（總體平均裝入量是12盎司）

Ha：μ！=12（μ>12或μ<12）

3. 計算檢驗統計量

因爲樣本數是100（n>30），根據中心極限定理，不論總體裝入量分佈如何，100盒對平均裝入量對抽樣分佈近似於正態分佈，可以運用正態分佈來進行檢驗。計算出z分數，需要分別計算x_bar, σ≈s

計算出：z=-2.91

4. 根據顯著性水平α確定拒絕域

如α=0.01，由於備選假設是雙尾檢驗，因此每側都是α/2=0.005，對應拒絕域爲z<-2.576或z>2.576

5. 將檢驗統計量計算值與拒絕域進行比較，得出結論

由於z=-2.91處於z<-2.576的拒絕域，因此拒絕原假設，選擇備選假設Ha：μ！=12（μ>12或μ<12）

計算觀察對顯著性水平-p值，讓讀者自己判斷是否接受原假設

前述的假設檢驗過程，拒絕域和相應的α值是在檢驗之前選擇的，結論是拒絕或者不拒絕原假設。凌一個陳述統計檢驗結果的表達是：給出不同原假設的範圍，讓讀者來決定是否拒絕原假設。這個不認同的度量值陳爲檢驗觀測的顯著性水平（observed significance level）

查表計算p值的步驟

1. 根據樣本數據，計算相應的統計量z值(或t值等)

2. 根據統計量z值，確定p值：

如果檢驗是單側的，p值就是相對於z偏向備選假設方向的那塊區域面積。因此，如果備選假設的形式是>,則p值是z右側區域的面積，如果備選假設的形式是<,則p值是z左側區域的面積（見下圖）

如果檢驗是雙側的，p值是超過z塊區域面積的2倍。因此，如果z是正的, 則p值是右側區域面積的2倍，如果z是負的, 則p值是左側區域面積的2倍（見下圖）

利用統計軟件進行檢驗，一般會給出檢驗的p值，可以用p值和置信水平α進行比較:

如果p<α，則拒絕H0，接受Ha
如果p>α，則接受H0

常用假設檢驗的類型

總體均值的假設檢驗：正態z統計量

假設檢驗運用的條件：

1.樣本是從目標總體中隨機抽取

2.大量樣本（n>=30）, 根據中心極限定理，這個條件保證量無論總體分佈的形狀如何，統計量都是近似正態分佈的

以正態（z）統計量爲基礎的大樣本假設檢驗方法

總體均值的假設檢驗：學生t統計量（小樣本）

假設檢驗運用的條件：

1.樣本是從目標總體中隨機抽取

2. 一般爲小樣本（小於30），樣本的總體近似服從正態分佈

以t統計量爲基礎的大樣本假設檢驗方法

總體比例的假設檢驗

總體比例（百分比）的推斷經常在二項分佈的“成功“概率爲p的清晰下進行討論，比如確定某商品的次品概率是否小於5%，某節目青年觀衆的比例是否大於20%等等。

假設檢驗運用的條件：

1.樣本來自二項分佈中隨機抽取

2. 樣本量n很大，滿足np>=15且nq>=15，其中q=1-p

以p統計量爲基礎的大樣本假設檢驗方法

總體方差的假設檢驗

主要是對某個變量對變異性檢驗，方差檢驗常常運用在質量控制，比如檢驗每瓶罐頭裝入量對標準差是否小於0.1 盎司。

方差檢驗運用統計量:（n-1）s^2/σ ^2，其中n爲樣本個數，s^2爲方差，σ ^2爲總體方差對假設值，如果總體符合正態分佈，統計量分佈符合卡方分佈（樣本方差的抽樣分佈）

假設檢驗運用的條件：

1. 樣本從總體中隨機抽取

2. 樣本來自的總體服從近似正態分佈(卡方分佈對樣本大小不敏感，對總體是否正態分佈非常敏感)

以χ 統計量爲基礎的大樣本假設檢驗方法

發表評論

所有評論

還沒有人評論，想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.

基於單樣本單統計推斷-假設檢驗

假設檢驗單的要素

假設檢驗中的概率

假設檢驗的步驟

1. 確定目標檢驗參數

2.確定原假設H0和備選假設Ha

3. 計算檢驗統計量

4. 根據顯著性水平α確定拒絕域

5. 將檢驗統計量計算值與拒絕域進行比較，得出結論

計算觀察對顯著性水平-p值，讓讀者自己判斷是否接受原假設

查表計算p值的步驟

常用假設檢驗的類型

總體均值的假設檢驗：正態z統計量

總體均值的假設檢驗：學生t統計量（小樣本）

總體比例的假設檢驗

總體方差的假設檢驗

教你用Perl實現Smgp協議

如何通過前端表格控件在10分鐘內完成一張分組報表？

win11關閉自動檢測病毒刪文件

千兆寬帶實際網速能到達多少？

SQL查詢語句基礎構成

離散概率分佈與期望

t分佈（Student t distribution）——正態分佈的小樣本抽樣分佈

魔法函數%matplotlib 解決matplotlib畫圖在Jupter/IPython中不顯示

IntelliJ idea 給git下來的項目配置python環境（Anaconda）

https://yachay.unat.edu.pe/blog/index.php?comment_area=format_blog&comment_component=blog&comment_co

linux以太網驅動總結