學習更多,歡迎關注微信公衆號:Excel辦公小技巧
Excel容易上手、直觀展示,工作中遇到的大部分數據,初期可採用用Excel進行描述統計分析,以便進行後續動作。今天介紹Excel中如何完成描述性統計。
一、使用Excel自帶數據分析工具
先介紹自帶的分析工具,可一次性輸出一些統計項的數值,樣例數據85行6列。
找不到數據分析工具?
需要將分析庫加載項添加到選項卡展示:
-
依次點擊“文件”-“選項”-“加載項”;
-
“管理”中點擊“Excel加載項”,點擊“轉到”,勾選“分析工具庫”即可。
添加好加載項後,使用步驟如下:
-
點擊“數據”-右側找到“數據分析”,彈出的窗口中,分析工具選擇“描述統計”;
-
“輸入區域”選擇要分析的數據區域,根據需求選擇分組方式及是否勾選“標誌位於第一行”;
-
選擇輸出區域,以及勾選下面需要使用的統計選項,確定即可。
結果如下:
詳細內容會在介紹函數時進行說明。
二、使用函數進行描述性統計
2.1 數據分佈趨勢
最大值:max函數
最小值:min函數
極差:最大值-最小值
組距:極差/組數
頻數分佈:frequency函數
算數平均值:average函數
中位數:median函數
衆數:mode函數
算數平均值、中位數和衆數是常用的中心趨勢的度量。
相對位置度量-分位數:
-
quartile函數,分位數常見的有25%分位數,75%分位數;而0%分位數即我們常用的最小值,100%分位數即最大值,50%分位數即中值。
-
小數據集,一般約等於取整最近的數,對於下四分位數向上取整,下四分位數向上取整。
直方圖:
-
選擇數據區域-插入-直方圖
-
設置橫軸座標軸格式,箱寬度輸入前面計算好的組距(或者根據指定組數輸入到箱數進行設置)
2.2 離散程度
極差:即最大值和最小值之差,一定程度上可以反應數據的差異程度,不過不能反應中間其他數據情況。Excel中可用:=MAX(數據區域)-MIN(數據區域)來計算。
平均差:也是表示數值間差異的指標之一,即數值與算數平均值差異值的絕對值之和除以數值個數,數值越大,數值間差異程度越大,Excel中使用公式:=AVEDEV(數據區域)計算
方差:反應數據集中數據對於算數平均值的偏離情況,
計算樣本方差=(數值-均值)的平方和/(數值個數-1),Excel中使用=VAR(數據區域)或VAR.S(數據區域);
計算總體方差=(數值-均值的平方和)/(數值個數),Excel中使用=VAR.P(數據區域);
標準差:樣本標準差=樣本方差開根號;總體標準差=總體方差開根號,Excel中使用STDEV或STDEV.S計算樣本標準差,STDEV.P計算總體標準差。
變異係數:標準差和平均值的比值,均值不爲零時有意義,無量綱,可以消除尺度和量綱的影響。
峯度:KURT函數,反映分佈曲線的峯部的尖峭或扁平程度。峯度係數>0,表示兩側分佈極端值越少,呈尖峯分佈;峯度係數<0,分佈較平坦。
偏度:skew函數,反映分佈的非正態程度。偏度係數>0時,呈現右偏,即長尾在右;偏度係數<0時,呈現左偏,長尾在左。