【数据挖掘数学基础】01描述统计(上)

一般刚从事或者刚接触数据分析的同学们都是从写一份分析报告开始的,那么我们应该如何去写一份完整的报告?或者说,拿到一份数据的时候,我们应该从哪几个维度方向去分析数据,这便是这章需要了解的描述统计分析。


目录

一、五个角度

二、总量指标

三、相对指标


一、五个角度

当我们拿到数据时可以考虑从这5个维度分析:

  1. 总体规模的描述——总量指标
  2. 对比关系的描述——相对指标
  3. 集中趋势的描述——平均指标
  4. 离散程度的描述——变异指标
  5. 分布形态的描述——偏态与峰态

这样看好像很难明白,我们可以拿个案例举例:华润万家超市后台记录一年内53万余条消费者的消费数据,如何做描述统计分析?

二、总量指标

  1. 定义:反映一定时间、空间条件下某现象的总体规模、总水平或成果统计指标。
  2. 应用:
  • 按内容分:单位总量指标(人、物……),标志总量指标(营业额、利润……);如:我们可以看华润这一年有多少消费者来这里消费,一共销售出去的物品有多少件,超市一年的销售额,利润,成本等。
  • 按时间不同分:时期指标、时点指标。如:超市大型活动(周年庆,双十一)期间的销售情况,一年四季分(或行业周期)的销售情况,也可以看一看每天几点销售额情况。
  • 按计量不同分:实物指标,价值指标,劳动量指标。和上面第1点有点类似,可以统计超市总销售量,销售商品的总价值等。

三、相对指标

  1. 定义:是指两个相互联系的指标数值之比。
  2. 应用:
  • 计划完成程度相对指标:实际完成/目标完成;如:华润万家今年销售额完成率是多少。
  • 结构相对指标:部分/总体;如:某畅销产品销量/总体销量
  • 比例相对指标:一部分/另外一部分;如:食品/日用品两个库存量大产品相对比
  • 比较相对指标:A的指标/B的相同指标;如:华润食品销量/竞争对手大润发的食品类销量
  • 强度相对指标:某总量指标/另一性质不同但关联的总量指标;如:每单客单价=总的销售额/总的订单数,每个员工的价值=总生产价值/总人数
  • 动态相对指标:报考期/基期;如:今年销售额和去年销售额的比较(环比和同比)

……

因后面的平均指标、变异、偏态、峰态指标会比较复杂所以会单独写一个章节。

有趣的事情即将发生,赶紧看下一章吧!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章