假設檢驗也叫顯著性檢驗,是以小概率反證法的邏輯進行推理,是判斷假設是否成立的統計方法。
一般,首先假設樣本對應的總體參數或分佈是與已知的總體參數或分佈相同的,然後根據統計量的分佈規律來分析樣本數據,利用樣本信息判斷是否支持當前假設,並對檢驗假設作出取捨抉擇。該方法作出的結論是概率性的,不是絕對的肯定或否定。
[]T檢驗的概念:
T檢驗是用於兩個樣本(或樣本與總體)平均值差異程度的檢驗方法。利用T分佈理論來推斷差異發生的概率,從而判斷兩個平均數的差異是否顯著。
[]適用條件:
-
樣本分佈符合正態分佈。
-
當樣本數較小時,要求樣本隨機取自正態總體。
-
當兩個樣本均數比較是,要求兩個樣本的總體方差相等。(齊差性)
[]T檢驗的用途:
-
樣本均數與總體均數的比較
-
兩樣本均數的比較
[]假設檢驗的步驟:
1、建立檢驗假設和確定檢驗水準
檢驗假設是針對總體特徵而言,包括相互對立的兩個方面,即兩種假設:一種是無效假設或稱原假設、零假設,符號爲H0,它是要否定的假設;另一種是備擇假設,記爲H1,它是H0的對立面。二者是從反證法的思想提出的, H1和H0是相互聯繫、又相互對立的假設。
假設檢驗還需根據不同研究目的事先設置是否拒絕原假設的判斷標準,即檢驗水準。檢驗水準也稱顯著性水準,它指無效假設H0爲真,但被錯誤地拒絕的一個小概率值,一般取檢驗水準α =0.05。
單側檢驗和雙側檢驗:
• 在進行T檢驗時,如果其目的在於檢驗兩個總體均數是否相等,即爲雙側檢驗。 例如檢驗某種新減肥藥物與常用減肥藥的效果是否相同?就是說,新藥效力可能比舊藥好,也可能比舊藥差,或者力相同,都有可能。
• 如果我們已知新藥效力不可能低於舊藥效力,例如新藥劑從理論上推知其效果不可能低於舊藥劑,這時,無效假設爲H0:μ1=μ2, 備擇假設爲H1: μ1>μ2 , 統計上稱爲單側檢驗。
2、選定檢驗方法和計算檢驗統計量
要根據研究設計的類型和統計推斷的目的選用不同的檢驗方法。如成組設計的兩樣本均數的比較用T檢驗,多個樣本均數的比較用F檢驗。
檢驗統計量是用於抉擇是否拒絕H0的統計量(因此在我們確定檢驗假設H0,H1時,檢驗方法和檢驗統計量就已經確定了),其統計分佈在統計推斷中是至關重要的,不同的檢驗方法要用不同的方式計算現有樣本的檢驗統計量值。
3、確定p值和作出推斷結論。
這裏的P值是指由H0成立時的檢驗統計量出現在由樣本計算出來的檢驗統計量的末端或更末端處的概率值。
當P≤ α時,結論爲按所取檢驗水準拒絕H0,接受H1,這樣做出結論的理由是:在H0成立的條件下,出現等於及大於現有檢驗統計量值的概率P≤ α ,是小概率事件,這在一次抽樣中是不大可能發生的,即現有樣本信息不支持H0因而拒絕它;若P>α,即樣本信息支持H0,就沒有理由拒絕它,此時接受它。
[]T檢驗類型:
1、單體檢驗
用於檢驗樣本的分佈期望是否等於某個值,其統計量服從自由度爲n-1的T分佈:
2、雙體檢驗
用於檢驗兩組樣本的分佈期望是否相等,又分爲配對雙體檢驗和非配對雙體檢驗。
配對雙體檢驗的兩組樣本數據是一一對應的,而非配對雙體檢驗的兩組數據則是獨立的。 例如藥物實驗中,配對雙體檢驗適用於觀察同一組人服用藥物之前和之後,非配對雙體檢驗適用於一組服用藥物而一組不服用藥物。
2.1 配對雙體檢驗
配對雙體檢驗針對配對的兩組樣本。配對雙體檢驗假設兩組樣本之間的差值服從正態分佈。如果該正態分佈的期望爲零,則說明這兩組樣本不存在顯著差異。零假設爲 H0:μ=μ0,統計量服從n-1的T分佈,其中d是差值的平均值,s是差值的樣本標準差。
2.2 非配對雙體檢驗
非配對雙體檢驗針對獨立的兩組樣本。非配對雙體檢驗假設兩組樣本是從不同的正態分佈採樣出來的。根據兩個正態分佈的標準差是否相等,非配對雙體檢驗又可以分兩類。
一種是分佈標準差相等的情況。零假設是兩組樣本的分佈期望相等,統計量 T 服從自由度爲 n1+n2-2的T分佈:
其中x1和x2分別是兩組樣本的平均值,n1和n2分別是兩組樣本的大小,s1和s2分別是兩組樣本的樣本標準差。
另一種是分佈標準差不相等的情況。零假設也是兩組樣本的分佈期望相等,統計量 T 服從 T 分佈:
d.f. 爲T分佈的自由度。