統計學 分類數據分析
- 分類數據和統計量
- 擬合優度檢驗
- 列聯分析: 獨立性檢驗
- 列聯表的相關係(三個係數)
1.分類數據和統計量
分類數據
統計量
其中 k爲求和的項數, l 爲要估計的參數個數
具體的參數含義可以結合下面的案例來理解
2.擬合優度檢驗
直接進入案例
例1
-
步驟1:分析 H0與H1
H0 :觀察頻數與期望頻數一致 -
步驟2: 構造統計量
- 1.在本題中不用估計參數,參與求和的項數爲2,所以自由度爲2-0-1=1
- 2.根據原來的男女比例估計期望的男女存活 的人數
- 3.代入計算
-
步驟3.得出結論
例2
- 步驟1:分析 H0與H1
H0 :觀察頻數與期望頻數一致 - 步驟2: 構造統計量
- 1.在本題中估計參數爲λ,l=1,參與求和的項數爲4,所以自由度爲2-0-1=1
注,這裏的 k=4是因爲手動把 >=3的數據都歸爲一類
λ的估計: 因爲H0假設服從參數爲λ的泊松分佈,泊松分佈的表達式入下
因此使用頻數分佈表計算出期望
根據泊松分佈的表達式計算出k爲0,1,2,3時的概率,得到下表
帶入公式求得統計量
- 1.在本題中估計參數爲λ,l=1,參與求和的項數爲4,所以自由度爲2-0-1=1
- 步驟3: 帶入得出結論
3.列聯分析: 獨立性檢驗
RT/CT爲該行/列的求和
話不多說,看例題來理解
例1
解析
H0:地區和原料等級之間是獨立的(不存在依賴關係)
H1:地區和原料等級之間不獨立 (存在依賴關係)
計算
其中
統計量
自由度爲(3-1)*(3-1)=4
累加
得出結論
4.3個相關係數的計算
注,下文中的均爲統計量