Excel進行描述性統計分析

學習更多,歡迎關注微信公衆號:Excel辦公小技巧  

    Excel容易上手、直觀展示,工作中遇到的大部分數據,初期可採用用Excel進行描述統計分析,以便進行後續動作。今天介紹Excel中如何完成描述性統計。

一、使用Excel自帶數據分析工具

    先介紹自帶的分析工具,可一次性輸出一些統計項的數值,樣例數據85行6列。

找不到數據分析工具?

需要將分析庫加載項添加到選項卡展示:

  1. 依次點擊“文件”-“選項”-“加載項”;

  2. “管理”中點擊“Excel加載項”,點擊“轉到”,勾選“分析工具庫”即可。

添加好加載項後,使用步驟如下:

  1. 點擊“數據”-右側找到“數據分析”,彈出的窗口中,分析工具選擇“描述統計”;

  2. “輸入區域”選擇要分析的數據區域,根據需求選擇分組方式及是否勾選“標誌位於第一行”;

  3. 選擇輸出區域,以及勾選下面需要使用的統計選項,確定即可。

結果如下:

    詳細內容會在介紹函數時進行說明。

二、使用函數進行描述性統計

2.1 數據分佈趨勢

最大值max函數

最小值:min函數

極差:最大值-最小值

組距:極差/組數

頻數分佈:frequency函數

算數平均值:average函數

中位數:median函數

衆數:mode函數

    算數平均值、中位數和衆數是常用的中心趨勢的度量。

相對位置度量-分位數:

  1. quartile函數,分位數常見的有25%分位數,75%分位數;而0%分位數即我們常用的最小值,100%分位數即最大值,50%分位數即中值。

  2. 小數據集,一般約等於取整最近的數,對於下四分位數向上取整,下四分位數向上取整。

直方圖:

  1. 選擇數據區域-插入-直方圖

  2. 設置橫軸座標軸格式,箱寬度輸入前面計算好的組距(或者根據指定組數輸入到箱數進行設置)

2.2 離散程度

極差:即最大值和最小值之差,一定程度上可以反應數據的差異程度,不過不能反應中間其他數據情況。Excel中可用:=MAX(數據區域)-MIN(數據區域)來計算。

平均差:也是表示數值間差異的指標之一,即數值與算數平均值差異值的絕對值之和除以數值個數,數值越大,數值間差異程度越大,Excel中使用公式:=AVEDEV(數據區域)計算

方差:反應數據集中數據對於算數平均值的偏離情況,

計算樣本方差=(數值-均值)的平方和/(數值個數-1),Excel中使用=VAR(數據區域)或VAR.S(數據區域)

計算總體方差=(數值-均值的平方和)/(數值個數),Excel中使用=VAR.P(數據區域)

標準差:樣本標準差=樣本方差開根號;總體標準差=總體方差開根號,Excel中使用STDEV或STDEV.S計算樣本標準差,STDEV.P計算總體標準差

變異係數:標準差和平均值的比值,均值不爲零時有意義,無量綱,可以消除尺度和量綱的影響。

峯度:KURT函數,反映分佈曲線的峯部的尖峭或扁平程度。峯度係數>0,表示兩側分佈極端值越少,呈尖峯分佈;峯度係數<0,分佈較平坦。

偏度:skew函數,反映分佈的非正態程度。偏度係數>0時,呈現右偏,即長尾在右;偏度係數<0時,呈現左偏,長尾在左。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章