七周成为数据分析师--知识体系篇①

青春看起来如此完美,没空闲去浪费时间

1 知识体系

数据分析的本质其实是解决问题。

分析的结构层次:

  1. 底层数据的收集(用户行为-产生的原始数据)
  2. 数据业务化(原始数据-加工数据)
  3. 数据可视化(加工数据-可视化数据)
  4. 数据决策和执行(可视化数据-决策数据)
  5. 数据模型(数据决策-数据应用/产品)
  6. 数据战略(数据工具-数据体系/战略)

三种核心思维
1、结构化
往往就是思维导图,举个例子
线下销售的产品,8月销售额下降,和去年同比下降20%,找原因?
答:从内部、外部两个维度;
内部:消费者、地区、时间/外部:市场竞争、市场容量、政策风险;再细分:
内部:消费者-新、老;地区:A、B、C-各地区销售单价/销售率;时间:上、中、下,是否遇到促销
外部:市场竞争-同类商家、上下游商家;市场容量:饱和;政策:国家/地区

其实结构化也可以和其他的方法相结合。

2、公式化

同样去解答上一个例子

答:销售额=销量*客单价
利润=销售额收益-成本
销售额单一吗?不是,是多个商品SKU的总和
而地区销量由什么组成?是不同线下渠道的累加

销量再细挖=人均销量*购买人数

接下来再结合第一种结构化思维
销售额度分为地区A和其他地区
分为销量和客单价
销量=人均销量*购买人数(新客+老客)
客单价=原价 *折扣率

举一个新的例子
AARRR模型中第一个A-如何获取用户?
A=主动+被动
主动有活动、推广等等—细分渠道的总和
而渠道=(曝光量*转化率)

被动有邀请应用商店搜索
转发人数*人均邀请量*转化率

3、业务化
是一种结合实际业务的一种思维

举个例子,预估某地共享单车投放量?
答:地区流动人口、区域人口密度、城市交通数据、个人保有自行车量、单车损耗率等

再举个例子,一家销售公司没有起色,进行分析
答:销售人员效率降低,产品质量不佳、价格平平、营销渠道方案有误、等等


数据分析的思维技巧

  1. 象限法:比如高频、低频为横轴,垂直、综合为纵轴来划分APP,或者是立体象限,RFM模型分别为X\Y\Z轴。

  2. 多维法:比如用户统计维度:性别、年龄;用户行为维度:注册用户、用户偏好、兴趣、流失;消费维度:消费金额、频率、水平;商品维度:品类、品牌、属性等等

  3. 假设法:举个例子

公司节日进行营销,APP销量上周上升20%,分析是否是由于营销活动导致。
答:假设该营销活动有效,则会有一定用户购买,就能产生一定可观测行为,进而能从评论中获取相关活动字眼,进而分析活动字眼出现占比。
假设没有效,则行为没有变化,通过历史用户评论占比,推出购买数。

再举个例子:
某自营商品提价,会导致收入怎样变化?
答:提价,销量一定会下跌,下跌多少?
假设流量不变,流量和营销渠道正相关,渠道没变,流量不变,商品价格影响转化率,确定转化率波动。
接着就是找出平时转化率,预估提价转化率变化。怎么做呢?继续假设各类用户对价格敏感度不同,将用户先分类为忠诚、普通、羊毛
最后不同用户层次数量不同,反应不同,忠诚用户转化率变化低,羊毛基本不变,重点分析普通用户的变化。

  1. 指数法
    比如分析一个用户的价值:用户忠诚度、贡献金额、社交指数
    法一:用户忠诚度=1-(1/消费次数)
    一般用反比例函数,结合线性加权分析比较准确
    【结合一下业务场景】
    其实对于商家来说,难的是0次到1次,1次到2次的转换,但其实50次和100次对于拓展新流量来说是没有太大区别的
    法二:用户忠诚度=消费次数/(消费次数+1),也是一种收敛,在0-1-2这样的区间变化快,适用于有0的场景。

推荐一个经典的热度公式
log(uv+5*评论,2)+(现在的时间-刚发出的时间)/10
涵盖浏览量,评论数,距今时间,且可以一定程度上通过强收敛过滤刷单行为

  1. 二八法
    突出抓重点的思维,关注topN,有时数据模型划分训练集和测试集会用到

  2. 对比法
    好的数据指标,一定是比率和比例。
    例如: 竞争对手对比、类别对比、特征属性对比、时间环比、转化环比、
    举个例子:孤数不证
    节日大促,女生消费占比从60%到70%,得到结论女生节目爱消费?
    答:是不准确的,第一占比提高不代表绝对值提高,某商品平日销售100万,女生占60万,节日销售80万,女生占50万?
    第二,竞争对手上升比我们快?

  3. 漏斗法:一种流程化的思考方式,结合对比的方法
    思考:
    一天人流量多少?
    分类别:早餐店?快餐店?西餐店?中餐店?高端店?
    分时段:早,中,晚,上班高峰,午间高峰,下班高峰
    分地理位置:分交通情况: 分竞争情况:
    一年呢?
    是不是要考虑节假日,考虑政策,考虑双十一,年中大促销?


建立业务数据模型
1指标模型
比如提到电商,我们会想客单价。
提到活动,我们讲ROI投资回报率=利润/投资总额*100%,当然还有很多衍生。
提到内容,我们讲流量uv(独立访问量),pv(网页访问量),GMV(网站成交金额)
下图是涉及业务指标的一个模型
如图一个简单的模型
首先从邀请和传播到渠道曝光,我们分析病毒传播量,最后邀请用户数
从渠道到客户下载,我们分析用户获取成本,广告费用,下载转化率
从下载到客户新用户注册,我们分析下载成功率
从注册到注册成功,我们分析注册成功率

在顾客使用的周期,我们分析活跃率?留存率?流失率
从顾客离开到又使用,我们分析回流率

2、讲讲都有哪些指标名词
第一:市场营销领域:
用户生命周期(新,老,流失)
用户价值:sum(贡献率=(产出量/投入量*100%))
RFM模型:R:最近一次消费时间、M:消费金额、F:消费频次

第二种:产品运营指标:
AARRR模型
用户获取:曝光量,渠道转化率,ROI
提高活跃:会话次数、访问时长、平均访问次数
提高留存:某段时间再次使用,七日留存率
盈利获利:ARPU,某时间段内每位用户平均收入,占比
ARPPU:平均每付费用户收入
客单价:每位用户平均购买商品的金额(销售总额/顾客总数
客单价与ARPU区别在于加没加时间这个维度

LTV=ARPU*1/流失率
LTV用户生命周期价值:只看一个周期内的 value就行。
(举个栗子:从简单开始,以一天的新增用户为对象,计算LTV7
1月1日新增了100个用户不管这100个用户在未来7天流失了几个;
不管这100个用户有几个花钱;
不管这100个用户哪个花的多,哪个花的少;
只看这100个用户在这7天内一共花了1000块钱。
那么LTV7就是10块钱)
为了说明一段时间的LTV,我们再举个复杂的栗子:
1月1日新增了100个用户,1月2日新增了200个用户,1月3日新增了300个用户。
这3天总共新增了600个用户,这600个用户的LTV7要怎么算?

1日的100个新增在未来7天一共花了150块钱;

2日的200个新增在未来7天一共花了400块钱;

3日的300个新增在未来7天一共花了900块钱;

那么1-3日的600个新增的 LTV7 = (150+400+900)/(100+200+300)= 2.41
所以大家说 LTV 的时候后面都会跟一个数字,这个数字就是统计周期。

LTV经常会和CAC(Customer Acquisition Cost)“用户获取成本”、PBP(Payback Period)“回收期”一起来讲。
市场普遍认为 LTV>CAC的时候公司是有可能性的,LTV<CAC的时候模式是无意义的,而LTV/CAC=3的时候是公司最能健康发展的(小于3说明转化效率低,大于3说明在市场拓展上还太保守)。PBP的意思是花出去的用户获取成本可以在多长时间内回本。PBP越短越好,说明资金周转快,企业能更快增长。

自传播:K因子(用户能带几个新用户)=用户数x平均邀请人数x邀请转化率


三、电子商务指标

购物篮分析:笔单价、件单价、成交率、购物篮系数(连带率)
复购率:一段时间内多次消费的用户占总消费用户数的占比
比如:4月有1000名消费者,其中600名在本月消费了不止一次,则复购率60%
回购率:一段时间内消费过的用户,在下一段时间内仍旧消费的占比。
比如:4月有1000名用户消费了,这1000名中在5月有500名又消费了,则回购率为50%
流量指标
pv(浏览网页次数),容易虚高
uv(一定时间内访问网页的人数),独立访客,通过cookie和ip
新老访客占比:推广,拉新,粘性,太低太高都不好
访问时间:区别标题党
访客平均访问页数:衡量访客深度
首页访客占比:对新用户的界面友好指数

举个例子:
重度访问用户占比(访问时间5分钟以上):访客访问时长+uv
有效消费会话占比:用户会话次数+成交率

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章