20應用統計考研複試要點(part4)--統計學

學習筆記,僅供參考,有錯必糾

具體原理:分類數據分析


賈俊平統計學


分類數據分析


  • 卡方檢驗

卡方檢驗是對分類數據的頻數進行分析的統計方法。

  • 卡方統計量

χ2=(f0fe)2fe \chi^2 = \sum \frac{(f_0-f_e)^2}{f_e}

  • 擬合優度檢驗

擬合優度檢驗是用卡方統計量進行統計顯著性檢驗的重要內容之一。它是依據總體分佈狀況,計算出分類變量中各類別的期望頻數,與分佈的觀察頻數進行對比,判斷期望頻數與觀察頻數是否有顯著差異,從而達到對分類變量進行分析的目的。

  • 列聯表

列聯表是由兩個以上的變量進行交叉分類的頻數分佈表。

  • 獨立性檢驗

獨立性檢驗就是分析列聯表中行變量和列變量是否相互獨立。

  • φ相關係數

φ相關係數描述2X2列聯表數據相關程度最常用的一種相關係數。它的計算公式爲:
φ=χ2/n φ=\sqrt{\chi^2/n}

  • 列聯相關係數

列聯相關係數又稱列聯繫數,簡稱c係數,主要用於大於2X2列聯表的情況,c係數的計算公式爲:
c=χ2/χ2+n c=\sqrt{\chi^2/{\chi^2 + n}}

  • V相關係數

鑑於φ相關係數無上限,c係數小於1的情況。克萊默提出了V相關係數,V相關係數的計算公式爲:
V=χ2nmin[(R1),(C1)] V=\sqrt{ \frac{\chi^2}{n*min[(R-1),(C-1)]}}

  • 條件百分表的方向

一般來說,在列聯表中變量的位置是任意的。也就是說.既可以把變量X放在列的位置,也可以放在行的位置。如果變量X與Y存在因果關係,令X爲自變量(原因),Y爲因變量(結果),那麼一般的做法是把自變量X放在列的位置。

  • 卡方分佈的期望值準則

前面談到的用卡方分佈進行獨立性檢驗,要求樣本量必須足夠大,特別是每個單元中的期望頻數(理論頻數)不能過小,否則應用卡方檢驗可能會得出錯誤的結論。

一條準則是:
如果只有兩個單元,每個單元的期望頻數必須是5或5以上。

另一條準則是:
倘若有兩個以上的單元,如果20%的單元期望頻數fef_e小於5,則不能應用卡方檢驗。

不滿足準則時的解決方法:
fef_e較小的類別合併,使得合併後的類別的fe5f_e ≥ 5

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章