卡方檢驗,又稱χ2檢驗,是一種非參數檢驗,主要是比較兩個以及兩個以上樣本率以及兩個分類變量之間是否具有顯著的相關性,其根本思想是統計樣本的實際觀測值與理論推斷值之間的偏離程度。
卡方檢驗有3種推導過程:
- 四格表法的卡方檢驗;
- 行列表法的卡方檢驗;
- 列聯表法的卡方檢驗;
卡方檢驗應用情況
舉個例子,兩獨立樣本率的比較時,
- 所有的理論數T≥5並且總樣本量n≥40,用Pearson卡方進行檢驗.
- 如果理論數T<5但T≥1,並且n≥40,用連續性校正的卡方進行檢驗.
- 如果有理論數T<1或n<40,則用Fisher’s檢驗.
卡方:
>? chisq.test()
chisq.test(x, y = NULL, correct = TRUE,
p = rep(1/length(x), length(x)), rescale.p = FALSE,
simulate.p.value = FALSE, B = 2000)
x :a numeric vector or matrix. x and y can also both be factors.
y :a numeric vector; ignored if x is a matrix. If x is a factor, y should be a factor of the same length.
#計算理論頻數
chisq.test()$expected
通過 n>=40 ,T >5
皮爾遜檢驗
cor.test()
n>=40 , 1<= T <5
修正的卡方檢驗
chisq.test(x, correct = TRUE)
n<40 || 1< T <5
fisher.test()
詳細內容參考:https://www.jianshu.com/p/bb0bd72bc428
http://blog.fens.me/r-test-x2/