[學習筆記]B站視頻:磨劍之作,七週成“師”!【七週成爲數據分析師】- 第一週

視頻來源:磨劍之作,七週成“師”!【七週成爲數據分析師】
七個方面很重要:數據思維、業務知識、Excel、數據可視化、SQL、統計學、Python

數據分析的結構層次:
(用戶行爲-變成-原始數據):底層數據的收集/產品端收集:數據採集簡稱埋點
(原始數據-變成-加工數據):數據業務化/產品需要什麼數據?
(加工數據-變成-可視化數據/信息):數據可視化/產品的表現如何?
(可視化數據-變成-數據決策):數據的決策和執行/怎麼讓產品更好
(數據決策-變成-數據產品/應用):數據模型/產品開始自動化和系統化的運營
(數據工具-數據體系/戰略):數據戰略/指導未來

數據思維

什麼是好的數據分析思維-三種核心思維:結構化、公式化、業務化

結構化

例子:現在有一個線下銷售的產品。
我們發現8月的銷售額度下降,和去年同比下降了20%。我想先觀察時間趨勢下的波動,看是突然暴跌,還是逐漸下降。再按照不同地區的數據看一下差異,有沒有地區性的因素影響。我也準備問幾個銷售員,看一下現在的市場環境怎麼樣,聽說有幾家競爭對手也縮水了,看一下是不是這個原因。顧客訪談也要做,但是往常一直找不出原因,這次我也不抱希望,姑且試試吧。要是還找不出原因,那我也很絕望啊。

結構化的思考來源於麥肯錫(大名鼎鼎的金字塔思維)-層層遞進和拆解
將分析思維結構化:

  1. 將論點歸納和整理
  2. 將論點遞進和拆解
  3. 將論點完善和補充

具體金字塔的思考方式是:
核心論點:尋找金字塔的塔頂,它可以是假設,是問題,是預測,是原因
結構拆解:自上而下,將核心論點層層拆解成分論點,上下之間呈因果或依賴關係
MECE:相互獨立,完全窮盡。論點之間避免交叉和重複,分論點們要儘量完善。例如銷售金額和銷售量就有一定的重合,這樣是不好的。
驗證:不論核心論點還是分論點,都應該是可量化的,用數據說話。它們必然是可驗證的。例如宏觀環境不好,造成士氣下降這種很虛的,難以量化論證的,就不是一個好的論點。

結構化最核心的就是一個思維導圖(推薦工具-XMind)
將結構化的思考方式應用到例子上:
可以畫出如下的思維導圖
在這裏插入圖片描述
畫出思維導圖後,可以藉助一些思維分析方法來找原因,對某些分支節點,可能要去做調研驗證,查表,查數據驗證。還可以通過標顏色:如標紅色表示不相關,標灰色表示相關。

思維導圖更適合個人,團隊性的數據分析可以進行類似頭腦風暴的方式,具體地:

  • 查看資料及背景,將結論列成一張表/卡片
  • 把表上的結論,依據主題分類
  • 將同一類型的結論,按順序區分
  • 討論同一級別的共同結論,將其結論放在上一段位置

結構化不是完美的。

公式化

結構化是分析的思維,但它還不夠數據,而且難免有發散的缺點。
公式化的核心是把一切都變成可量化
公式化的原則最小不可分割,即拆解之後一定是一個很細很細的指標或者維度。
公式化實際上主要就是依賴+、-、*、/四則運算。

公式化的舉例:
銷售額=銷量*客單價
利潤=銷售額收益-成本
銷售額=多個商品的總和
地區的銷量=不同線下渠道的累加
銷量還能繼續細挖嘛?可以考慮人均銷量和購買人數。

一般的:不同類別的業務疊加可以用加法,減法常用來計算業務間的邏輯關係,乘法和除法是各種比例或者比率。

講一個結構化和公式化結合的關於運營的案例:
在這裏插入圖片描述
所以在考慮公式化之後,上一小節結構化後的思維導圖則可以被修改爲:
在這裏插入圖片描述注意:雖然我們一步步細分,可以分的非常細,但是有時候太細也不好。例如上表中的掠奪率,因爲雖然掠奪這種可以分細,但是未必準確。因爲是從競爭對手那裏得到的數據,不容易獲取,而且一定保真,所以這些數據分析的價值和帶來的收益就會直線下降。所以掠奪率那一塊我們可以作爲分析的論點,但是本身能產生的價值有限。

業務化

結構化和公式化能解決大部分問題,但不能解決所有問題。
一個例子引出業務化:
如何預估上海地區的共享單車投放量?
可以考慮的分論點有:

  1. 從城市流動人口計算
  2. 從人口密度計算
  3. 從城市交通數據計算
  4. 從保有自行車計算

雖然我們找出了很多點,但是我們找的很多點可能是孤立的,因爲這些點往往因爲我們坐在電腦端,拿着思維導圖畫,導致這些點是有缺失的,連不起來面。例如上面的例子中,我們就沒有考慮到:
單車是有損耗的,計算公式中應該考慮單車的消耗因素。

所以光有結構化+公式化,容易產生爲分析而分析,沒有深入理解業務,俗稱不接地氣。而好的數據思維,則還要考慮業務化,具備業務思維。

所以你的分析貼不貼合業務,要問自己三個問題:

  1. 有沒有從業務方的角度思考(要考慮業務化)
  2. 真的分析出原因了嗎?(分析出的是現象還是真正的原因,詳見下面的例子和分析)
  3. 能不能將分析結果落地:(分析師要跟進業務方)

真的分析出原因了嗎?例子:
一家銷售公司業績沒有起色,對它進行了分析

  • 銷售人員的效率降低,因爲士氣低落
  • 產品質量不佳,和同期競爭對手比沒有優勢
  • 價格平平,顧客並不喜歡
    分析:用結構化思考+公式化拆解,獲得的最終分析論點。很多時候,是現象。數據是某個結果的體現,但不代表原因。所以有時候要想知道真正的原因,還需要業務思維再去細究一層。

如何從業務化的思維考慮:

  1. 與業務方多溝通
  2. 換位思考,多從業務方角度思考
  3. 參與到業務當中去,代入個人到實際場景中

總結:
結構化思維(捋順思路)-結構化數據(將其可數據化)-結構化業務數據(落地,貼合業務)

數據分析的思維技巧

三種核心思維是框架性的指引,實際應用中也應該藉助一些技巧工具和方法,它們應該足夠簡單和有效。

象限法

例如:
在這裏插入圖片描述
在這裏插入圖片描述
象限法最經典的應用就是RFM(8個象限),
在這裏插入圖片描述
象限法
核心:策略驅動
優點:直觀,清晰,對數據進行人工的劃分。劃分結構可以直接應用於策略
應用:適用範圍廣,戰略分析,產品分析,市場分析,客戶管理,用戶管理,商品管理等
須知:象限劃分可以按中位數,也可以按平均數,或者是經驗劃分

多維法

在這裏插入圖片描述
劃分出一個個維度之後,我們就可以組成一個個立方體,通過這些立方體,我們就可以進行多維分析,例如我想知道某個地區某段時間的銷量是跌了還是上升了。多維法在大數據量,維度豐富的情況下,統計起來更加有優勢。
但是多維法有一個缺點(辛普森悖論):
下圖是不同學院男女平均錄取率的對比,看上去女生比男生錄取率高。
在這裏插入圖片描述
但實際上,因爲法學院男生多,男生的平均錄取率是被法學院拉低了。而單看商學院和法學院,均是男生錄取率比女生高。
在這裏插入圖片描述
這個陷阱在統計學裏被稱爲辛普森悖論,可見,在維度分的不夠細的情況下的多維法,容易遇到這種陷阱。爲了規避辛普森悖論,一個技巧叫鑽取(Drill-down):把本身的維度細分,即維度精細,細分挖掘。所以鑽取不僅會讓分析的粒度更細,同時能規避辛普森悖論。
多維法
核心:精細驅動的思維
優點:處理大數據量,維度豐富且複雜的數據有較好的效果。但是維度過多,會消耗不少時間
應用:只要數據齊全且豐富,均可以應用
須知:對不同維度進行交叉分析時,需要注意辛普森悖論

假設法

先看一個題目:
現在,馬上,公司要派你去貝寧出差,如果你只能攜帶一個揹包,你會往裏面裝什麼東西?你爲什麼要往裏面裝它?
答案可以有千百種,但是最恰當的答案是:雖然貝寧這個地方我並不熟悉,但我假設它在非洲,那麼現在我得考慮炎熱的情況…
很多時候,數據分析是沒有數據可明確參考的:比如新進入一個市場,公司開拓某樣產品。老闆讓你預測一年後的銷量,或者產品的數據基礎非常糟糕,你拿不到數據。

例子1:
公司在節日進行了一次營銷活動,APP上的銷量數據整體比上週上升了20%。因爲統計失誤問題,拿不到明確數據,也就是說,活動效果是一個黑盒。現在的問題是,銷量本身就有可能因爲節目而提高,那麼怎麼證明活動是有效或者無效的呢?

假設活動是有效的

  • 思考一下,活動有效的話,會發生什麼事情?
  • 會有一定數量的用戶購買,如果能證明這條,那麼我們有理由相信活動是有效的。
  • 用戶通過活動購買商品,會發生什麼可觀測的行爲呢?假設有一些用戶會評論留言,那麼可以統計提及活動的字眼。
  • 當用戶提及了這次營銷活動,接下來的問題是,有效了多少?10%,20%?(例子中說銷量提高了20%,所以這裏我們考慮提高了20%中的多少)
  • 假設參與活動的用戶行爲沒有變化,那麼通過歷史數據的用戶評論佔比,反推購買人數。(比如以前100人購買,有5個人評論,那麼如果這次活動有100個人評論,那麼就有2000個人購買,然後算在當日銷量中的佔比)

例子2:
你是自營電商的數據分析師,現在想商品提價後,收入會不會有變化?,你會怎麼做?

  • 假設商品提價後,銷量一定會下跌,問題是銷量下跌多少?
  • 首先假設流量不會有變化,流量和渠道營銷正相關,商品價格影響轉化率,那麼現在確定轉化率的波動。
  • 找出平時的轉化率(譬如爲20%),預估提價後的轉化率變化。假設各類型用戶對價格敏感度不同,那麼將用戶劃分成忠誠XX,普通XX,羊毛XX…
  • 不同用戶層次數量不同,反應不同。忠誠用戶轉化率變化極低,羊毛幾乎不會轉化…這些數據可以憑藉經驗做出假設。最後彙總。

假設法其實是一種啓發性的思考,雖然我們拿不到一些具體的數據,但我只能做出假設,然後通過這些假設,或者一種摸索的形式來做出推斷。
假設法
核心:一種啓發思考驅動的思維
優點:當沒有直觀數據或者線索能分析時,以假設先行的方式進行推斷,這是一個論證的過程。
應用:它更多是一種思考方式,假設-驗證-判斷。
須知:不止可以假設前提,也能假設概率或者比例,一切都能假設,只要自圓其說。

指數法

有時候我們有很多數據,但是數據不知道怎麼使用,因爲要探究的問題都是比較開放的,比如,中國今年的經濟指標如何?美國NBA最佳球星是誰?競爭對手產品變現的如何?哪位是天善學院最帥的男人?
指數法就是制定一個如何衡量的問題,即制定一個標準(指數)。
例如:
NBA比賽數據貢獻值:(得分+籃板+助攻+搶斷+封蓋)-(出手次數-命中次數)-(罰球次數-罰球命中次數)-(失誤次數/球員上場比賽的場次)
很多時候,我們有數據,但不知道如何應用。就是因爲缺乏了一個有效的方向。這個方向可以稱爲目標指數。指數法的核心是通過將數據進行加工成指數,達到聚焦的目的。
指數法通常有三種:線性加權反比例log
線性加權:設置不同的權重,如c1*用戶忠誠度+c2*用戶貢獻金額+c3*用戶社交指數=用戶價值
反比例:1-k/x,如1-1/(消費次數)=忠誠指數
注意:1-k/x單調遞增,k=1,消費1次,1-1/1=0,消費2次,1-1/2=0.5,相差很大,但消費50次和消費100次則很接近,且消費越多會收斂到1,這就和實際情況比較吻合
補充:x/(x+1)=1-1/(x+1)也是反比例的一種。
log:和反比例法類似,都是爲了讓數字達到收斂的目的,反比例法是爲了讓數字收斂到0和1,而log法純粹是爲了讓數字減小,讓變量變化很大的情況下,指數表達不大。

指數法
核心:一種目標驅動的思維
優點:目標驅動力強,直觀,簡潔,有效。對業務有一定的指導作用。一旦射流指數,不易頻繁變動。
應用:和假設法不同,假設法是缺乏有效的數據,指數法是無法利用數據而將其加工成可利用的。
須知:指數法沒統一的標準,很多指數法更依賴經驗的加工。

二八法

二八法脫胎於二八法則,在數據分析中,類似的,20%的數據會產生80%的收益。二八法則本身又被稱爲帕累托法則,對應有帕累託圖
二八法則在數據分析上的三種應用:

  • 數據中,20%的變量將直接產生80%的效果,數據分析更應該圍繞這20%作文章。
  • TopN,很多老闆喜歡看的,他們會持續關注TopN的數據,是一個非常好的習慣,尤其在部分行業(例如銷售總監會關注最出色的二十名銷售)。這樣就能聚焦核心,將精力聚焦在覈心上。
  • 雖然指標很多,但往往有些指標更有價值,二八法則不僅能分析數據,也能管理數據。

二八法
核心:只抓重點的思維
優點:和業務緊密相關,和KPI更緊密相關。幾乎花費最少的精力就能達到不錯的效果,性價比很優
應用:二八法則存在於幾乎所有的領域,所以這種分析思維沒喲侷限。
須知:在條件允許的情況下,數據分析依舊不能放棄全局,否則會讓思路變得狹隘。

對比法

核心兩句話(以前的一些數據分析大師總結的):
好的數據指標,一定是比例或者比率
好的數據分析,一定會用到對比

考慮一個例子:
老王賣水果,今天賣了1000元水果,這個數據有分析價值麼?
沒價值,不和昨天對比,不知道上升還是下降
老王賣水果,今天賣了1000元水果,昨天賣了800元,這個數據有分析價值麼?
數據是上升的,但價值也不大,沒和其他競爭者對比
老王賣水果,今天賣了1000元水果,隔壁的老馬賣了2000元,這個數據有分析價值麼?
老王賣水果,今天賣了1000元水果,昨天賣了800元,隔壁的老馬昨天賣了3000元,今天賣了2000元,這個數據有分析價值麼?
說明老馬跌的比老王厲害,這個數據價值比之前大,但仍然不能說明問題
老王花了3000元的銷營銷成本賣了1000元水果,這個數據有分析價值麼?
老王其實是王健林,他有幾百億資產,他賣水果賣了1000元,這個數據有分析價值麼?

例子:
節日大促,女生消費佔比從60%變爲70%,得出女生節日愛消費,這個結論正確嗎?

  • 這個結論不正確
  • 因爲佔比提高了,不代表絕對值提高了。某商品平時銷售額100萬女生佔60萬,節日銷售額80萬女生佔56萬,女生真的消費變高了?不對,節日反而不消費。
  • 誰說節日銷售額會提高?別忘了競爭對手
  • 孤數不證,所以很多時候我們要對比,和各種數據對比。這樣才能得出一個靠譜的結論。
    我們經常要考慮的是競爭對手對比,類別對比,特徵和屬性對比,時間同比環比,轉化對比,前後變化對比
    注意:前後變化對比很重要,因爲你有時候我們做了一個大促銷,看似消費額提高了,但是很多情況下,未來的銷售額會下降,因爲我們提前把用戶的購買,消費慾望給釋放掉。所以,我們有時候看節日提高了50%,但後面會跌的更慘。

對比法
核心:一種挖掘數據規律的思考方式
優點:對比法可以發現很多數據間的規律,它可以與任何思維技巧結合,比如多維對比、象限對比、假設對比等
應用:對比更多是一種習慣,是數據分析的牛角尖,一次合格的分析,一定要用到n次對比
須知:在條件允許的情況下,數據分析依然不能放棄全局,否則會讓思想變得狹隘

漏斗法

對應可以畫出漏斗圖(一個倒三角),從上到下依次是,展現,點擊,訪問,諮詢,訂單。我們可以根據漏斗圖得到一個過程的轉化率。但光得到轉化率沒用,還必須和競爭對手,過去等作對比。

漏斗法
核心:一種流程化的思考方式
優點:單一的漏斗法沒有用,轉化率20%,能說明說明呢?它要和其他分析思維結合,比如多維,比如對比
應用:涉及到變化和流程的都能用
須知:單一的轉化率沒有用

如何在業務時間鍛鍊數據分析思維

想要把數據分析變成自己的一個本能的想法,一定要進行大量的練習。而要鍛鍊好數據分析思維,有2點必不可少:好奇心、多練習

好奇心

好奇心就是多問自己爲什麼。大家肯定都聽過啤酒和尿布的經典案例。但其實啤酒和尿布是錯的(它是美國的一個分析師自己杜撰出來的)。但重要的是我們看到這個案例應該如何思考

  • 買了尿布的人會買啤酒,但買啤酒的人會買尿布麼?
    在啤酒旁邊放尿布未必是靠譜的
  • 尿布旁邊應該擺放其他東西麼?啤酒是否是最好的選擇?
    尿布旁邊,最好的話,還是放奶粉等與嬰兒更相關的東西,爲什麼,因爲之前案例是男人去買,但如果女人去買怎麼辦,女人看到啤酒不一定會買
  • 怎麼擺放啤酒?部分還是全部品類?
    假設啤酒是對的,那麼應該怎麼擺放啤酒,放所有啤酒還是幾罐啤酒,放價格高的還是價格低的啤酒
  • 場景型的擺放是否比品類擺放更好?
  • 數據呢?
    補充:
    事實上,臨時小貨架進行category management是非常常用的手段,比如麪包區會放置花生醬的小貨架,並不是說原有的正常產品貨架就要取消。啤酒和尿布的例子也許在中國並不適用,但是並不是說這個例子沒有任何道理,針對目標消費者的大量的數據和調研也許並不能讓一家公司永遠選擇最正確的路,但確實可以避免老闆自以爲是拍腦袋做出愚蠢的決定,現實中這樣的例子並不少,尤其是創業人羣。(參考知乎:https://zhuanlan.zhihu.com/p/20494828)

多練習

怎麼把好奇心用在分析中呢?多練習,怎麼練習?
一種是去生活中練習
走在夜市上,不妨思考:

  • 這個夜市一天的人流量是多少?一年的人流量又是多少?
    如結構法+公式法來估算一下,再用假設法去涉及幾個數字
  • [現煮小卷] (某個店面)每天的營業額是多少?
  • 這個夜市,哪家店的利潤是最高的?它比最低的高出多少?原因是什麼?
  • 如何從數據分析的角度提高最低店的營業額?
  • 夜店準備弄一次活動,如何涉及一套數據評估方案評估活動效果?
    第一點想到的是預估,然後想怎麼改進。

另一種是去工作中練習
在工作中,思考:

  • 爲什麼領導或者同事不認同這次分析?原因是什麼?
  • 如果我的職位比現在高兩級,我會去怎麼分析?
    換位思考,從更高的角度去考慮
  • 讓我再次分析一年前做的那個案例,我會怎麼去優化和改進?
    覆盤,再次學習,大家要有記筆記和保留數據的習慣
  • 我的歷史分析,能用三種核心思維去優化和迭代嗎?
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章