統計學 分類數據分析

統計學 分類數據分析

  • 分類數據和x2x^2統計量
  • 擬合優度檢驗
  • 列聯分析: 獨立性檢驗
  • 列聯表的相關係(三個係數)

1.分類數據和x2x^2統計量

分類數據

在這裏插入圖片描述

x2x^2統計量

在這裏插入圖片描述
其中 k爲求和的項數, l 爲要估計的參數個數
具體的參數含義可以結合下面的案例來理解

2.擬合優度檢驗

直接進入案例

例1

在這裏插入圖片描述

  • 步驟1:分析 H0與H1
    H0 :觀察頻數與期望頻數一致

  • 步驟2: 構造統計量
    在這裏插入圖片描述

    • 1.在本題中不用估計參數,參與求和的項數爲2,所以自由度爲2-0-1=1
    • 2.根據原來的男女比例估計期望的男女存活 的人數在這裏插入圖片描述
    • 3.代入計算
  • 步驟3.得出結論
    在這裏插入圖片描述

例2

在這裏插入圖片描述

  • 步驟1:分析 H0與H1
    H0 :觀察頻數與期望頻數一致
  • 步驟2: 構造統計量
    在這裏插入圖片描述
    • 1.在本題中估計參數爲λ,l=1,參與求和的項數爲4,所以自由度爲2-0-1=1
      注,這裏的 k=4是因爲手動把 >=3的數據都歸爲一類
      λ的估計: 因爲H0假設服從參數爲λ的泊松分佈,泊松分佈的表達式入下
      在這裏插入圖片描述
      因此使用頻數分佈表計算出期望
      λ=0109/200+165/200+222/200+33/200+41/200=0.61000000000000010.61λ = 0*109/200 + 1*65/200+2*22/200+3*3/200+4*1/200=0.6100000000000001 ≈0.61
      根據泊松分佈的表達式計算出k爲0,1,2,3時的概率,得到下表在這裏插入圖片描述
      帶入公式求得統計量
  • 步驟3: 帶入得出結論在這裏插入圖片描述

3.列聯分析: 獨立性檢驗

RT/CT爲該行/列的求和
在這裏插入圖片描述
在這裏插入圖片描述
話不多說,看例題來理解

例1

在這裏插入圖片描述
在這裏插入圖片描述
解析
H0:地區和原料等級之間是獨立的(不存在依賴關係)
H1:地區和原料等級之間不獨立 (存在依賴關係)
計算
其中45.36=140/500162/500500=140162/500=45.36=140/500*162/500*500=140*162/500=
在這裏插入圖片描述
統計量
自由度爲(3-1)*(3-1)=4
累加(5245.36)2/45.36(52-45.36)^2/45.36 以此類推
得出結論
在這裏插入圖片描述

4.3個相關係數的計算

注,下文中的x2x^2均爲統計量

在這裏插入圖片描述在這裏插入圖片描述
在這裏插入圖片描述

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章