數據分析-常用分析方法-(1)描述性分析-用Excel實現

由於我目前還沒有熟練掌握SPSS,Python等高級一點的工具,而且描述性分析過於簡單,所以本文將介紹如何用Excel實現描述性分析。

一、描述性分析基本概念

描述分析(描述性統計分析)就是用來概括、描述數據的整體狀況以及數據各特徵的統計方法。

描述的內容分爲:

  1. 集中趨勢:平均數,衆數、中位數、四分位數
  2. 離散程度:方差、標準差、極差、變異係數、四分位差
  3. 分佈形態:偏度、峯度

其中峯度和偏度是用來測量數據正態分佈特性的兩個指標。

拓展:一般在工作中還會使用環比和同比來進行描述性分析。

環比增長率=(本期數-上期數) / 上期數 * 100% 

如:(2019年10月銷量-2019年9月銷量 )/2019年9月銷量*100%

同比增長率=(本期數-上一同期數) / |上一同期數| *100%

如:(2019年10月銷量-2018年10月銷量)/2018年10月銷量*100%

拓展:標準化及歸一化

數據的標準化(normalization)是將數據按比例縮放,使之落入一個小的特定區間。在某些比較和評價的指標處理中經常會用到,去除數據的單位限制,將其轉化爲無量綱的純數值,便於不同單位或量級的指標能夠進行比較和加權。其中最典型的就是數據的歸一化處理,即將數據統一映射到[0,1]區間上。

1、標準化:

公式:  x*=\frac{x-\mu }{\sigma }(其中μ爲所有樣本數據的均值,σ爲所有樣本數據的標準差)

結果:數值的均值爲0,標準差爲1的正態分佈

應用:(1)數據不穩定,存在異常值和噪音的時候(2)距離計算,PCA降維,數據不符合正態分佈的時候

2、歸一化:

公式:x*=\frac{x-min}{max-min}

結果:把數據變成[0,1]區間的數值

應用:(1)輸出結果範圍有限定(2)數據穩定,不存在極端的最大值或最小值(3)數據符合正態分佈

二、用Excel的函數實現描述性分析

1、平均數:從上圖可以看出:老用戶的平均消費額比新用戶的平均消費額高;

2、四分位數:

用QUARTILE函數來返回一組數據的四分位數。

語法:QUARTILE(array,quart)

QUARTILE 函數語法具有下列參數:

array:要求得四分位數值的數組或數字型單元格區域。

quart:指定返回哪一個值。

quart值 QUARTILE()函數返回

0

最小值

1 第一個四分位數(25%處)
2 中位數(50%處)
3 第三個四分位數(75%處)
4 最大值

3、標準差

用STDEVP 函數來計算參數給定的整個總體計算標準偏差。

語法:STDEVP(number1,[number2],...)

從上圖可以看出:新用戶標準差比一班的要低,說明新用戶的銷售額分佈比較分散。

4、箱線圖

箱線圖的作用:

  1. 直觀明瞭地識別數據批中的異常值
  2. 利用箱線圖可以判斷數據批的偏態和尾重
  3. 利用箱線圖可以同時比較幾批數據的形狀

三、用Excel自帶的分析工具庫完成描述分析

1、首先判斷是否已經加載分析工具庫,如果你的Excel中有如下菜單,說明已經啓用:

2、如果未啓用,請按如下方法啓用:

a、點擊 [文件] > [選項]菜單

b、選擇左側“加載項”,並在右側底部管理位置,選擇"Excel加載項",點擊“轉到”

c、選擇“分析工具庫” 和 “分析工具庫 - VBA”,確定完成

d、完成上述步驟,Excel工具庫加載完成

3、開始分析工作

點擊“數據分析”後,步驟如下圖,

 

 So easy~

Excel自帶的數據分析工具可以最快速地幫助我們完成描述性分析的工作,但是分析的結論需要我們數據分析師自己總結歸納,數據分析的核心不是軟件的使用技能,而是業務能力,切記切記。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章