由於我目前還沒有熟練掌握SPSS,Python等高級一點的工具,而且描述性分析過於簡單,所以本文將介紹如何用Excel實現描述性分析。
一、描述性分析基本概念
描述分析(描述性統計分析)就是用來概括、描述數據的整體狀況以及數據各特徵的統計方法。
描述的內容分爲:
- 集中趨勢:平均數,衆數、中位數、四分位數
- 離散程度:方差、標準差、極差、變異係數、四分位差
- 分佈形態:偏度、峯度
其中峯度和偏度是用來測量數據正態分佈特性的兩個指標。
拓展:一般在工作中還會使用環比和同比來進行描述性分析。
環比增長率=(本期數-上期數) / 上期數 * 100%
如:(2019年10月銷量-2019年9月銷量 )/2019年9月銷量*100%
同比增長率=(本期數-上一同期數) / |上一同期數| *100%
如:(2019年10月銷量-2018年10月銷量)/2018年10月銷量*100%
拓展:標準化及歸一化
數據的標準化(normalization)是將數據按比例縮放,使之落入一個小的特定區間。在某些比較和評價的指標處理中經常會用到,去除數據的單位限制,將其轉化爲無量綱的純數值,便於不同單位或量級的指標能夠進行比較和加權。其中最典型的就是數據的歸一化處理,即將數據統一映射到[0,1]區間上。
1、標準化:
公式: (其中μ爲所有樣本數據的均值,σ爲所有樣本數據的標準差)
結果:數值的均值爲0,標準差爲1的正態分佈
應用:(1)數據不穩定,存在異常值和噪音的時候(2)距離計算,PCA降維,數據不符合正態分佈的時候
2、歸一化:
公式:
結果:把數據變成[0,1]區間的數值
應用:(1)輸出結果範圍有限定(2)數據穩定,不存在極端的最大值或最小值(3)數據符合正態分佈
二、用Excel的函數實現描述性分析
1、平均數:從上圖可以看出:老用戶的平均消費額比新用戶的平均消費額高;
2、四分位數:
用QUARTILE函數來返回一組數據的四分位數。
語法:QUARTILE(array,quart)
QUARTILE 函數語法具有下列參數:
array:要求得四分位數值的數組或數字型單元格區域。
quart:指定返回哪一個值。
quart值 | QUARTILE()函數返回 |
0 |
最小值 |
1 | 第一個四分位數(25%處) |
2 | 中位數(50%處) |
3 | 第三個四分位數(75%處) |
4 | 最大值 |
3、標準差
用STDEVP 函數來計算參數給定的整個總體計算標準偏差。
語法:STDEVP(number1,[number2],...)
從上圖可以看出:新用戶標準差比一班的要低,說明新用戶的銷售額分佈比較分散。
4、箱線圖
箱線圖的作用:
- 直觀明瞭地識別數據批中的異常值
- 利用箱線圖可以判斷數據批的偏態和尾重
- 利用箱線圖可以同時比較幾批數據的形狀
三、用Excel自帶的分析工具庫完成描述分析
1、首先判斷是否已經加載分析工具庫,如果你的Excel中有如下菜單,說明已經啓用:
2、如果未啓用,請按如下方法啓用:
a、點擊 [文件] > [選項]菜單
b、選擇左側“加載項”,並在右側底部管理位置,選擇"Excel加載項",點擊“轉到”
c、選擇“分析工具庫” 和 “分析工具庫 - VBA”,確定完成
d、完成上述步驟,Excel工具庫加載完成
3、開始分析工作
點擊“數據分析”後,步驟如下圖,
So easy~
Excel自帶的數據分析工具可以最快速地幫助我們完成描述性分析的工作,但是分析的結論需要我們數據分析師自己總結歸納,數據分析的核心不是軟件的使用技能,而是業務能力,切記切記。