輕鬆學統計--中國mooc2

頻數分佈:初顯總體分佈特徵

統計資料通過統計分組後就形成統計數列。
一、統計數列分類
1.按品質標誌分組形成品質數列。
2.按數量標誌分析形成變量數列。

二、變量數列分類和構成
1.變量數列的分類
(1)單項式數列:用一個變量值表示一個組的數列。通常只適用於離散變
量,且在變量值較少的情況下使用。這種分組在實際中應用的較少。
(2)組距式數列:用一個區間表示一個組的數列,實際中使用較多。

 

2.變量數列構成的基本要素
(1)變量和次數(頻數)
(2)變量和比率(頻率)

 

三、變量數列編制方法
1.組限:上組限(U)、下組限(L)。
2.組距(i)= U–L。
3.全距(R)=Xmax–Xmin=變量的最大值-變量的最小值
[例]某班某門課的考試成績最高爲98分,最低爲45分
R=53分
4.組數(n)=全距/組距=R/i

但是如果全部數據中的最大值和最小值與其他數據相差懸殊,在組距式數列中,爲避免出現空白組(即沒有變量的組)或個別極端值被漏掉,第一組和最後一組可以採取“xx以下”或“xx以上”這樣的開口組。如上述例子採用開口組的形式可表示如下:

 

6.次數密度= 次數/組距
[例]第三組:13人/10分=1.3人/分。
7.對連續變量,只可編制組距式數列,且相鄰組限必須重疊。
8.對重疊組限,組限值單位數遵循“上組限不在內”的原則。
組限值單位:取值正好是某組組限(上限或下限)的單位。
[例]第二組的取值範圍[90、100);
第三組的取值範圍[100、110)。
第五組的取值範圍[120、130]。

9.組距式數列不僅可用於上述的連續型變量,它還適合於變量值較多的離散型變量。

 

上述要注意的是使用組中值代表一組數據有一個必要的假定條件,即各組數據在本組內呈均勻分佈或在組中值兩側呈對稱分佈,如果實際數據的分佈不符合這一假定,則組中值作爲一組數據的代表值會有一定的誤差。

一般爲了統計分析的需要,有時我們還需要觀察某一數值以下或某一數值以上的頻數或頻率之和,還可以計算出累積頻數累積頻率

 

統計圖表:展現數據最佳拍檔

一、統計表
統計調查所得來的原始資料,經過整理,得到說明社會現象及其發展過程的數據。把這些數據按一定的順序排列在表格中,就形成“統計表”。
統計表是表現數字資料整理結果的最常用的一種表格。
統計表是由縱橫交叉線條所繪製的表格來表現統計資料的一種形式。

二、統計圖
(一)直方圖
1.用於展示分組數據分佈的一種圖形
2.用矩形的寬度和高度來表示頻數分佈
---本質上是用矩形的面積來表示頻數分佈
3.在直角座標中,用橫軸表示數據分組,縱軸表示頻數或頻率,各組與相應的頻數就形成了一個矩形,即直方圖
4.直方圖下的總面積等於1
(二)條形圖
1.用寬度相同的條形的高度或長短來表示各類別數據
2.各類別可放在縱軸,也可以放在橫軸,縱置時也稱爲柱形圖(columnchart)

(三)累積頻數圖

所謂累積頻數即到某個特定數值爲止的總頻數,也就是頻數的累積總和。一般我們在計算累積頻數(次數)時採用向上累計和向下累計的方法。

(四)餅圖
用圓形及圓內扇形的角度來表示數值大小的圖形,主要用於表示一個樣本(或總體)中各組成部分的數據佔全部數據的比例,用於研究結構問題。

(五)折線圖

折線圖常用於顯示隨時間變化的數值,一般需要體現趨勢時才使用折線圖(如基於時間的趨勢)。

(六)曲線圖

1.鐘形分佈
特徵:中間大、兩頭小。
[例]身高、體重、智商、纖維長度、細紗強度、糧食作
物產量等。
(1)對稱分佈:正態分佈及t分佈。
(2)偏態分佈(不對稱分佈)

A、右(正)偏有極大值;
B、左(負)偏 有極小值。

 

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章