七週成爲數據分析師--知識體系篇①

青春看起來如此完美,沒空閒去浪費時間

1 知識體系

數據分析的本質其實是解決問題。

分析的結構層次:

  1. 底層數據的收集(用戶行爲-產生的原始數據)
  2. 數據業務化(原始數據-加工數據)
  3. 數據可視化(加工數據-可視化數據)
  4. 數據決策和執行(可視化數據-決策數據)
  5. 數據模型(數據決策-數據應用/產品)
  6. 數據戰略(數據工具-數據體系/戰略)

三種核心思維
1、結構化
往往就是思維導圖,舉個例子
線下銷售的產品,8月銷售額下降,和去年同比下降20%,找原因?
答:從內部、外部兩個維度;
內部:消費者、地區、時間/外部:市場競爭、市場容量、政策風險;再細分:
內部:消費者-新、老;地區:A、B、C-各地區銷售單價/銷售率;時間:上、中、下,是否遇到促銷
外部:市場競爭-同類商家、上下游商家;市場容量:飽和;政策:國家/地區

其實結構化也可以和其他的方法相結合。

2、公式化

同樣去解答上一個例子

答:銷售額=銷量*客單價
利潤=銷售額收益-成本
銷售額單一嗎?不是,是多個商品SKU的總和
而地區銷量由什麼組成?是不同線下渠道的累加

銷量再細挖=人均銷量*購買人數

接下來再結合第一種結構化思維
銷售額度分爲地區A和其他地區
分爲銷量和客單價
銷量=人均銷量*購買人數(新客+老客)
客單價=原價 *折扣率

舉一個新的例子
AARRR模型中第一個A-如何獲取用戶?
A=主動+被動
主動有活動、推廣等等—細分渠道的總和
而渠道=(曝光量*轉化率)

被動有邀請應用商店搜索
轉發人數*人均邀請量*轉化率

3、業務化
是一種結合實際業務的一種思維

舉個例子,預估某地共享單車投放量?
答:地區流動人口、區域人口密度、城市交通數據、個人保有自行車量、單車損耗率等

再舉個例子,一家銷售公司沒有起色,進行分析
答:銷售人員效率降低,產品質量不佳、價格平平、營銷渠道方案有誤、等等


數據分析的思維技巧

  1. 象限法:比如高頻、低頻爲橫軸,垂直、綜合爲縱軸來劃分APP,或者是立體象限,RFM模型分別爲X\Y\Z軸。

  2. 多維法:比如用戶統計維度:性別、年齡;用戶行爲維度:註冊用戶、用戶偏好、興趣、流失;消費維度:消費金額、頻率、水平;商品維度:品類、品牌、屬性等等

  3. 假設法:舉個例子

公司節日進行營銷,APP銷量上週上升20%,分析是否是由於營銷活動導致。
答:假設該營銷活動有效,則會有一定用戶購買,就能產生一定可觀測行爲,進而能從評論中獲取相關活動字眼,進而分析活動字眼出現佔比。
假設沒有效,則行爲沒有變化,通過歷史用戶評論佔比,推出購買數。

再舉個例子:
某自營商品提價,會導致收入怎樣變化?
答:提價,銷量一定會下跌,下跌多少?
假設流量不變,流量和營銷渠道正相關,渠道沒變,流量不變,商品價格影響轉化率,確定轉化率波動。
接着就是找出平時轉化率,預估提價轉化率變化。怎麼做呢?繼續假設各類用戶對價格敏感度不同,將用戶先分類爲忠誠、普通、羊毛
最後不同用戶層次數量不同,反應不同,忠誠用戶轉化率變化低,羊毛基本不變,重點分析普通用戶的變化。

  1. 指數法
    比如分析一個用戶的價值:用戶忠誠度、貢獻金額、社交指數
    法一:用戶忠誠度=1-(1/消費次數)
    一般用反比例函數,結合線性加權分析比較準確
    【結合一下業務場景】
    其實對於商家來說,難的是0次到1次,1次到2次的轉換,但其實50次和100次對於拓展新流量來說是沒有太大區別的
    法二:用戶忠誠度=消費次數/(消費次數+1),也是一種收斂,在0-1-2這樣的區間變化快,適用於有0的場景。

推薦一個經典的熱度公式
log(uv+5*評論,2)+(現在的時間-剛發出的時間)/10
涵蓋瀏覽量,評論數,距今時間,且可以一定程度上通過強收斂過濾刷單行爲

  1. 二八法
    突出抓重點的思維,關注topN,有時數據模型劃分訓練集和測試集會用到

  2. 對比法
    好的數據指標,一定是比率和比例。
    例如: 競爭對手對比、類別對比、特徵屬性對比、時間環比、轉化環比、
    舉個例子:孤數不證
    節日大促,女生消費佔比從60%到70%,得到結論女生節目愛消費?
    答:是不準確的,第一佔比提高不代表絕對值提高,某商品平日銷售100萬,女生佔60萬,節日銷售80萬,女生佔50萬?
    第二,競爭對手上升比我們快?

  3. 漏斗法:一種流程化的思考方式,結合對比的方法
    思考:
    一天人流量多少?
    分類別:早餐店?快餐店?西餐店?中餐店?高端店?
    分時段:早,中,晚,上班高峯,午間高峯,下班高峯
    分地理位置:分交通情況: 分競爭情況:
    一年呢?
    是不是要考慮節假日,考慮政策,考慮雙十一,年中大促銷?


建立業務數據模型
1指標模型
比如提到電商,我們會想客單價。
提到活動,我們講ROI投資回報率=利潤/投資總額*100%,當然還有很多衍生。
提到內容,我們講流量uv(獨立訪問量),pv(網頁訪問量),GMV(網站成交金額)
下圖是涉及業務指標的一個模型
如圖一個簡單的模型
首先從邀請和傳播到渠道曝光,我們分析病毒傳播量,最後邀請用戶數
從渠道到客戶下載,我們分析用戶獲取成本,廣告費用,下載轉化率
從下載到客戶新用戶註冊,我們分析下載成功率
從註冊到註冊成功,我們分析註冊成功率

在顧客使用的週期,我們分析活躍率?留存率?流失率
從顧客離開到又使用,我們分析迴流率

2、講講都有哪些指標名詞
第一:市場營銷領域:
用戶生命週期(新,老,流失)
用戶價值:sum(貢獻率=(產出量/投入量*100%))
RFM模型:R:最近一次消費時間、M:消費金額、F:消費頻次

第二種:產品運營指標:
AARRR模型
用戶獲取:曝光量,渠道轉化率,ROI
提高活躍:會話次數、訪問時長、平均訪問次數
提高留存:某段時間再次使用,七日留存率
盈利獲利:ARPU,某時間段內每位用戶平均收入,佔比
ARPPU:平均每付費用戶收入
客單價:每位用戶平均購買商品的金額(銷售總額/顧客總數
客單價與ARPU區別在於加沒加時間這個維度

LTV=ARPU*1/流失率
LTV用戶生命週期價值:只看一個週期內的 value就行。
(舉個栗子:從簡單開始,以一天的新增用戶爲對象,計算LTV7
1月1日新增了100個用戶不管這100個用戶在未來7天流失了幾個;
不管這100個用戶有幾個花錢;
不管這100個用戶哪個花的多,哪個花的少;
只看這100個用戶在這7天內一共花了1000塊錢。
那麼LTV7就是10塊錢)
爲了說明一段時間的LTV,我們再舉個複雜的栗子:
1月1日新增了100個用戶,1月2日新增了200個用戶,1月3日新增了300個用戶。
這3天總共新增了600個用戶,這600個用戶的LTV7要怎麼算?

1日的100個新增在未來7天一共花了150塊錢;

2日的200個新增在未來7天一共花了400塊錢;

3日的300個新增在未來7天一共花了900塊錢;

那麼1-3日的600個新增的 LTV7 = (150+400+900)/(100+200+300)= 2.41
所以大家說 LTV 的時候後面都會跟一個數字,這個數字就是統計週期。

LTV經常會和CAC(Customer Acquisition Cost)“用戶獲取成本”、PBP(Payback Period)“回收期”一起來講。
市場普遍認爲 LTV>CAC的時候公司是有可能性的,LTV<CAC的時候模式是無意義的,而LTV/CAC=3的時候是公司最能健康發展的(小於3說明轉化效率低,大於3說明在市場拓展上還太保守)。PBP的意思是花出去的用戶獲取成本可以在多長時間內回本。PBP越短越好,說明資金週轉快,企業能更快增長。

自傳播:K因子(用戶能帶幾個新用戶)=用戶數x平均邀請人數x邀請轉化率


三、電子商務指標

購物籃分析:筆單價、件單價、成交率、購物籃係數(連帶率)
復購率:一段時間內多次消費的用戶佔總消費用戶數的佔比
比如:4月有1000名消費者,其中600名在本月消費了不止一次,則復購率60%
回購率:一段時間內消費過的用戶,在下一段時間內仍舊消費的佔比。
比如:4月有1000名用戶消費了,這1000名中在5月有500名又消費了,則回購率爲50%
流量指標
pv(瀏覽網頁次數),容易虛高
uv(一定時間內訪問網頁的人數),獨立訪客,通過cookie和ip
新老訪客佔比:推廣,拉新,粘性,太低太高都不好
訪問時間:區別標題黨
訪客平均訪問頁數:衡量訪客深度
首頁訪客佔比:對新用戶的界面友好指數

舉個例子:
重度訪問用戶佔比(訪問時間5分鐘以上):訪客訪問時長+uv
有效消費會話佔比:用戶會話次數+成交率

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章