Excel进行描述性统计分析

学习更多,欢迎关注微信公众号:Excel办公小技巧  

    Excel容易上手、直观展示,工作中遇到的大部分数据,初期可采用用Excel进行描述统计分析,以便进行后续动作。今天介绍Excel中如何完成描述性统计。

一、使用Excel自带数据分析工具

    先介绍自带的分析工具,可一次性输出一些统计项的数值,样例数据85行6列。

找不到数据分析工具?

需要将分析库加载项添加到选项卡展示:

  1. 依次点击“文件”-“选项”-“加载项”;

  2. “管理”中点击“Excel加载项”,点击“转到”,勾选“分析工具库”即可。

添加好加载项后,使用步骤如下:

  1. 点击“数据”-右侧找到“数据分析”,弹出的窗口中,分析工具选择“描述统计”;

  2. “输入区域”选择要分析的数据区域,根据需求选择分组方式及是否勾选“标志位于第一行”;

  3. 选择输出区域,以及勾选下面需要使用的统计选项,确定即可。

结果如下:

    详细内容会在介绍函数时进行说明。

二、使用函数进行描述性统计

2.1 数据分布趋势

最大值max函数

最小值:min函数

极差:最大值-最小值

组距:极差/组数

频数分布:frequency函数

算数平均值:average函数

中位数:median函数

众数:mode函数

    算数平均值、中位数和众数是常用的中心趋势的度量。

相对位置度量-分位数:

  1. quartile函数,分位数常见的有25%分位数,75%分位数;而0%分位数即我们常用的最小值,100%分位数即最大值,50%分位数即中值。

  2. 小数据集,一般约等于取整最近的数,对于下四分位数向上取整,下四分位数向上取整。

直方图:

  1. 选择数据区域-插入-直方图

  2. 设置横轴座标轴格式,箱宽度输入前面计算好的组距(或者根据指定组数输入到箱数进行设置)

2.2 离散程度

极差:即最大值和最小值之差,一定程度上可以反应数据的差异程度,不过不能反应中间其他数据情况。Excel中可用:=MAX(数据区域)-MIN(数据区域)来计算。

平均差:也是表示数值间差异的指标之一,即数值与算数平均值差异值的绝对值之和除以数值个数,数值越大,数值间差异程度越大,Excel中使用公式:=AVEDEV(数据区域)计算

方差:反应数据集中数据对于算数平均值的偏离情况,

计算样本方差=(数值-均值)的平方和/(数值个数-1),Excel中使用=VAR(数据区域)或VAR.S(数据区域)

计算总体方差=(数值-均值的平方和)/(数值个数),Excel中使用=VAR.P(数据区域)

标准差:样本标准差=样本方差开根号;总体标准差=总体方差开根号,Excel中使用STDEV或STDEV.S计算样本标准差,STDEV.P计算总体标准差

变异系数:标准差和平均值的比值,均值不为零时有意义,无量纲,可以消除尺度和量纲的影响。

峰度:KURT函数,反映分布曲线的峰部的尖峭或扁平程度。峰度系数>0,表示两侧分布极端值越少,呈尖峰分布;峰度系数<0,分布较平坦。

偏度:skew函数,反映分布的非正态程度。偏度系数>0时,呈现右偏,即长尾在右;偏度系数<0时,呈现左偏,长尾在左。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章