深度好文,如何培養真正的數據分析思維?附實踐案例

源:古牧聊數據 ,作者:古牧君

朋友們好久不見,我之前寫過數據分析領域不少勸退性質的文章,但畢竟有很多朋友適合做這個、或者已經從事這個領域想要提升,所以不能“管殺不管埋”,還是要儘量給出一些解決方案。恰好最近在網上做了一次互動實踐,總結成文意圖幫助如下3類人的問題:

1,很多零基礎想要轉行做數據分析的朋友,在面試中如何證明自己有數據分析思維?

2,剛入行不久渴望提升的初級分析師,怎麼針對某個業務搭建一個還算ok的分析框架?

3,剛開始帶新人的資深分析師,如何預先知道大部分新人的共性問題、以便幫助他們提升進步?

一,背景與現狀

我一直認爲,能否提出一個好問題,是鑑別一個分析師水平段位的重要標準。什麼叫好問題?第一,它是大家真正關心的問題;第二,它不是零散的、東一榔頭西一棒槌的,最好能讓人感覺到你提出的問題是遍歷所有情況之後按優先級挑選出來的,以便讓人放心:我解決了這些問題,基本就可以高枕無憂了~

那麼問題來了,市面上教大家怎麼提出好問題的內容資料多麼?至少我沒看到~我看到的很多都是培訓工具技巧的,剩下比較用心的就是介紹一些諮詢分析方法,比如SWOT、波士頓四象限、PEST等等,然後把這些包裝成數據分析思維。我說不準到底對不對,但至少他們沒有試圖去解決我提出的問題

於是前不久我在線上發起了一次小規模的互動練習,形式很簡單,就是我出一個題,大家以回帖的方式給出分析框架。通過這次練習,我大概發現了新人普遍存在的問題,同時也隱約摸索到了怎麼教會新人

二,模擬情景出題

這個情景很現實,現在很多公司招聘分析師,不僅僅會有工具技能的考覈,還會重點看你有沒有分析思維。然而問題就來了,我很可能上家公司跟這家公司不在一個行業領域,分析套路沒法複用;同時我又還沒入職,沒法拿到這家公司的數據,我也沒法做實操的數據分析

古牧君在很久之前給過一個例子,就是從一個分析師的角度,全面的評估審視一個業務都存在哪些問題,以及給這些問題開出數據解決方案。當時是用微信小遊戲爲例子,有朋友反饋那個例子把結果講的很詳細,但對初學者來說不好模仿,因爲沒有過程。OK~那今天就重新提一個既有過程、又有結果的題目:

如果你要面試豆瓣的數據分析師崗位,請指出你覺得該app有哪些問題是特別需要解決的

三,互動練習展現出的問題

新人問題1:

該題目給出後,很快就有了第一輪互動回答。這輪迴答給出的回答有:

“首頁推薦tab下的內容是否讓用戶產生興趣”

“小組頁面“正在討論”的推薦貼是否有效”

“訪客參與度不高、生成內容的價值低”

“從商業價值上來看,豆瓣購買力不如小紅書,但是興趣愛好更多元化”

你會發現一個共同點:這些回答都是散點式的,沒有一個體系。當你開出的藥方沒有體系的時候,就很容易帶來2個問題。首先,因爲你只回答了一個點,所以面試官很容易就會在這個點上跟你進行深度糾纏,一旦你在這個點的某個細節表現得不如人意,就會影響整體的評價看法,畢竟你只給了一個點;其次,聽衆會顧慮,你指出的這個點是不是最亟待解決的?有沒有其他問題比這種更嚴重?會不會遺漏了那些點?

你看,正是因爲你的回答沒有體系化,所以無法呈現一個面,很容易讓人抓住該點窮追猛打,這是新人很容易犯的第一個問題。

新人問題2:

接下來,回答裏不僅有指出業務的問題,還附帶了解決方案:

“訪客參與度不高、生成內容的價值低”

——

“設置獎勵機制:鼓勵互動可以採取積分、等級、權限等獎勵鼓勵用戶深度參與”

“設置投票環節,內容爲社區用戶感興趣話題或時事,讓潛水用戶參與投票”

“優化推薦機制:前面通過一段時間的投票以及高贊評論優化出用戶感興趣話題”

“邀請kol和專業機構。平臺優先給高質量的內容推薦和流量”

“可量化的關鍵數據有參與度(量化指標:活躍訪客數、網頁停留時間、生成內容數),內容的價值(量化指標:內容的點贊、收藏參與數,內容的分享和傳播)”

這是第二個新人容易出現的問題,乍一看很走心,對產品和業務很熟悉,但細一看,屁股坐歪到產品運營崗位了。這些建議都不錯,但沒有站在數據分析師角度,最終雖然給出了一些量化指標,但基本都是爲了事後評估效果的,不是很建設性的意見~

總結一下,新人還很容易站在普通用戶視角,提出一些產品運營層面的問題建議。數據分析師確實需要先做用戶,但不能止於此,要學會站在平臺方視角指出問題並解決問題

新人問題3:

在經過線上的兩輪引導之後,有同學給出了這麼一個回答:

“豆瓣是一個UGC模式的興趣社區,所以想從內容角度討論一下這個問題。

內容可分爲:內容生產、內容推送、內容審覈。相關指標:內容數量、內容瀏覽量、內容互動數、內容傳播數”

“內容生產——如何保持可持續優質內容?

豆瓣普通用戶居多,內容生產多是生活化的,用戶價值偏低,所以社區需要鼓勵用戶多進行高質量的內容創作,在用戶成長路徑上滲透發帖行爲(參考知乎個人創作中心),也需要有一定的激勵機制:

· 情感激勵

用戶與用戶間:點贊、收藏、關注、轉發、評論等

平臺與用戶間:積分或等級制度、身份、活躍程度”

你會發現,這個回答仍然存在新人問題2,但它在新人問題1上的表現好了一些,明顯能提出一個看似完整的分析框架了。但隨之而來的就是,這個框架到底是否邏輯上順暢?

鑑於這個回答是比較典型的、可優化的一個狀態,下面就以這個回答爲基礎進行優化

四,比較像樣的回答應該是什麼樣

做一個好的分析師,需要先深度體驗業務。豆瓣作爲一個比較古早的互聯網產品,算是中文互聯網裏的異類,它嘗試過很多超前的理念和產品形態,但一直佛系躺平不溫不火,擁有相對獨特的調性。把豆瓣定位成一個UGC爲主的興趣社區,是OK的

在這個定位下,自然就要關注內容。針對“內容”搭建分析框架的過程,很多時候你就需要不僅僅是一個用戶視角了,需要具備平臺方的視角。不要再作爲一個用戶給平臺挑毛病,而是作爲平臺反思自己的問題,這兩者之間差異很大:

給平臺挑毛病的話,你可能會說:“爲啥平臺上都是一些辣雞內容?爲啥老給我推送一些殺豬盤?我想把一個博主推薦給朋友就很難......”一般當你用這種口吻提問題,大家只會覺得你確實是資深用戶,但並不專業

而站在平臺視角反思的話,你可以說:“有沒有什麼機制能夠鼓勵優質內容生產?內容生產後分發推送的機制是否合理?推送後用戶對內容的消費是否充分滿足?消費後對內容的分享擴散是否順暢、普遍?”你看,一個完整的內容流轉鏈條就出來了:內容生產、內容分發、內容消費、內容傳播。對~很多時候你模擬一個事物的自然流程,就是搭建分析框架的一個快捷的切入點

由於篇幅限制,我就只重點說說內容生產這塊。上面的那位同學已經摸到了關鍵,就是怎麼鼓勵優質內容生產?但這個問題並不清晰,因爲裏面有一個關鍵的概念沒有理清:什麼是優質的內容?我看一個視頻,跟看一篇文章,跟看一個自拍照,優質的評價是統一的麼?以及我看到一個帖子評論很多,就能說明ta是優質的麼?投訴舉報能不能作爲一個評價標準?

所以你看,優質的定義需要跟內容的形式結合,也需要憑藉不同的指標來衡量(正負評價都要考慮)


剛纔我們的評價都是一上來就很量化的,但有問題。因爲優質本身就是一個感性的評價,我們做數據分析師的需要時刻清楚,數據只是對決策的輔助即便是再理性的人他在決策的時候也必定是情感驅動的(參考《笛卡爾的錯誤》)。所以作爲數據分析師,你可以明確的提出自己的看法:熱議不代表優質,因爲這回包含很多譁衆取寵和拉踩論戰。理想狀態下優質的內容,應該是引發人的善意而非憤怒的,但內容的調性不是一個很容易被量化評價的維度,所以需要引入一些人工因素來輔助糾偏

至此我們可以總結一下針對內容生產環節的回答了:

首先,我們的目標是鼓勵優質內容的生產。但很關鍵的問題就是,需要平臺方明確對優質的定義,不見得要對用戶明牌,但自己需要很清楚並堅持下去。比如不能單純的炒作熱門追熱點搞審醜,這些不僅僅要靠簡單的量化指標鑑別,也需要配合一些人工輔助措施

其次,針對豆瓣不同的功能模塊和不同的內容形態,我認爲可以按如下方式判斷內容是否優質


點贊這種有很多友情成分在,比如我跟你很熟了,可能你發什麼東西我都會給你點個贊,這就對一些粉絲量很少的博主天然的不利。所以也要區分互動數據的來源,是友人還是純陌生人

同時,我認爲僅僅依靠過往這種大衆的一人一票並不見得能真的推選出優質的內容,這就需要在機制上有所設計。比如對內容舉報投訴的審覈和降權處理流程,以及對正反饋權重機制的調整,比如在UGC中培育一部分專業領域的PUGC專家,讓他們對特定領域的正反饋享受更高的權重(可以參考《原則》中提到的多輪加權投票方法)

那就會帶來一個新問題,怎麼識別某個領域的PUGC專家?可以單獨靠ta發佈內容的反饋,但其實更好的是有運營去對接驗證博主的資質,這樣纔會放心的給ta後續對內容的反饋賦予更高的權重,相當於一票頂一百票~

最後,解決了優質問題的發掘,同時也可以識別出劣質內容,尤其是披着馬甲號搞黃賭毒的。這裏可以通過觀察大量經舉報確認的違規賬號提取出共性規律,推測大概率可以依賴註冊時間、發佈內容的形式、發佈時間、賬號註冊IP地址等多個因素綜合識別。比如大量問題賬號都是剛註冊沒兩天就開始大量發ghs照片,這些賬號近期大量密集性增多,可以看看他們是否是一個團伙,來自共同的地方?

反正你看,真要想好好分析處理,可做的事情特別多。上面我們還只是列舉了一些思路和指標,但具體這些指標之間怎麼配合、用何種模型來量化判別篩選內容和人,都是需要數據分析師去細化考慮的點,此處就不一一展開了(這都已經4000字了)

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章