統計學 第四章 數據的概括性度量

統計學 第四章 數據的概括性度量

一、集中趨勢的度量
集中趨勢是指一組數據向某一中心值靠攏的程度,它反映了一組數據中心點的位置所在。
1.分類數據:衆數
(1)概念
衆數是一組數據中出現次數最多的變量值,用M。表示。
2.順序數據:中位數和分位數
中位數是一組數據排列後處於中間位置上的變量值,用Me表示。主要用於測量順序數據的集中趨勢,也適用於測量數值型數據的集中趨勢,不適合分類數據。
3.數值型數據:平均數
平均數也稱爲均值,它是一組數據相加後除以數據的個數得到的結果。平均數在統計學中具有重要的地位,是集中趨勢的最主要測量值,它主要適用於數值型數據,而不適用於分類數據和順序數據。
(1)簡單平均數與加權平均數
簡單平均數:根據未分組數據計算的平均數,用總體各單位標誌值簡單相加得到的標誌總量除以單位總量而得。
加權平均數:根據分組數據計算的平均數。
幾何平均數:n各變量值乘積的n次方根,用G表示。主要用於計算比率的平均。當變量是比率當形式時,採用幾何平均法計算平均比率更爲合理。
(2)衆數、中位數和平均數的特點與應用場景
衆數是一組數據分佈的峯值,不受極端值的影響。其缺點是具有不唯一性,一組數據可能有一個衆數,也可能有兩個或多個衆數,也可能沒有衆數。
衆數只有在數據量較多時纔有意義,當數據量較少時,不宜適用衆數。衆數主要適合作爲分類數據當集中趨勢測量值。
平均數是對數值型數據計算的,而且利用量全部數據信息,它是實際中應用最廣泛的集中趨勢測量值。
當數據呈現對稱分佈或接近對稱分佈時,3個代表值相等或接近相等,這時則應選擇平均數作爲集中趨勢的代表值。但平均值只要缺點是易受數據極端值的影響,對於偏態分佈的數據,平均數的代表性較差。因此,當數據爲偏態分佈,特別是當偏態程度較大時,可以考慮選擇衆數或中位數。

二、離散程度的度量
數據離散程度是數據分佈的另一個重要特徵,它反映的是各變量值遠離其中心值的程度。
1.分類數據:異衆比率
2.順序數據:四分位差
上四分位與下四分位之差,用Qd表示。
四分位差反映另中間50%數據的離散程度,其數值越小,說明中間的數據越集中;其數據越大,說明中間的數據越分散。
3。數值型數據:極差、平均差、方差和標準差
極差也稱全距,用R表示。

相對離散程度:離散係數
離散係數也稱爲變異係數,它是一組數據的標準差與其相應的平均數之比,

三、偏態與峯態的度量
集中趨勢和離散程度是數據分佈的兩個重要特徵,爲全面瞭解數據分佈的特點,還需要知道數據分佈的形狀是否對稱、偏斜的程度以及分佈的扁平程度等。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章