統計學第二週

知識點:描述性統計

本週是統計學學習小組-第二期的第二週,我們這周的學習內容是【描述性統計】,涉及到的二級知識點有三個,分別是:
1、集中趨勢:衆數、中位數、分位數、平均數(算術平均數、加權平均數、幾何平均數)
2、離散程度:數值型數據(方差、標準差、極差、平均差)、順序數據(四分位差)、 分類數據(異衆比率)、相對離散程度(離散係數)
3、分佈的形狀:偏態係數、峯態系

本週是統計學學習第二週,工作上好多雜七雜八的事情,還是自己安靜看書心情好。學習資料:統計學(第七版)第四章

集中趨勢:是指一組數據向某一中心值靠攏,它反映了一組數據中心點的位置所在。

1.衆數:一組數據中出現次數最多的變量值,用 M。表示。

2.中位數(順序數據):是數據排序後處於中間位置上的數據,中位數可以將數據分爲兩份。主要用於測度數據的集中趨勢,但不適用於分類數據。

中位數是一個位置代表值,其特點是不受極端值的影響,在研究收入分配時很有用。

3.四分位數(順序數據):也稱四分位點,它是一組數據排序後處於25%和75%位置上的值。通過三個點把數據分爲4部分,每部分是25%的數據。

但是確定的方法卻有多種:

4.平均數(數值型數據):它是一組數據相加後除以個數得到的結果。

        算術平均數 與加權平均數

        幾何平均數:是n個變量值乘積的n次方根,用G表示

    但是公式並不好理解,讓我們來看看具體應用:一位投資者持有一種股票,連續4年的收益率分別爲4.5%,2.1%,25.5%,1.9%,要求計算該投資者4年內的平均收益率。

    

離散程度:

數值型數據(方差、標準差、極差、平均差):

極差:數據極大值與極小值之差

平均差:也稱平均絕對離差,它是各變量值與其平均數離差絕對值的平均數

方差和標準差:

方差是各變量值與其平均數離差(各項變量與總體平均數之差叫離差)平方的平均數

標準差是方差的開方,與方差不同的是,標準差有度量,與變量值的計量單位相同,因此它的實際意義要比方差清楚。

順序數據(四分位差):也稱內距或四分位距,是上四分位數與下四分位數之差

      反應了中間50%的數據離散程度,數值越小,說明中間數據越集中;數值越大,說明中間數據越分散。四分位差不受極值的影響。

分類數據(異衆比率):指非衆數數組的頻數佔總頻數的比例

      異衆比率越大,衆數的代表性越差;異衆比率越小,衆數的代表性越好

相對離散程度(離散係數):也稱爲變異係數,它是一組數據的(標準差/其相應的平均數)

離散係數是測度數據離散程度的統計量,主要用於比較不同樣本數據的離散程度。離散係數越大,離散程度也就大。

分佈的形狀:

集中和離散程度是數據發佈的兩個重要特徵,但要全面瞭解數據的分佈特點,還需要知道數據的分佈形狀是否對稱,偏斜的程度以及分佈的扁平的程度。偏態和峯態就是對分佈形狀的測度。

偏態:

峯態:峯態通常是與標準正態分佈相比較而言的。如果是標準的正態分佈則峯態係數爲0。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章