數據如何驅動業務優化?這有一份產品人必讀知識清單

數據時代,判斷一個互聯網企業成功與否的標準之一,就是衡量它各個環節的運營是否形成了“數據飛輪”。那麼對於一個互聯網從業者來說,是否具有數據意識、是否能夠用數據發現並解決問題,將決定了他是否能夠成爲一名合格產品人。

10月11日,DT君邀請到了E-Bizcamp CEO、DTALK 創始人顧青,給大家深入講解了數據驅動業務優化的核心能力。本文根據顧青分享實錄整理。

剛好最近有一個話題:爲什麼美國沒有運營崗位?我今天就將結合這個問題來講講。

很多國內的企業,寧願招上百個運營人員,也不願意去建立一個完整的數據團隊來做業務增長,以至於最後的產量並沒有達到預期。而硅谷很多公司的團隊規模很小,卻能做到快速增長、健康盈利。這背後的差異也取決於公司的驅動模式。

根據我參與的所有線下活動和講座收集回來的數據發現,對於數據驅動這件事情比較關心的是產品經理(56.5%)。還有很大一塊就是運營端的同學。除此之外,現在有一個職能也屬於上升期,叫做“數據產品”。

從數據驅動所需技能來看,網站和APP的數據分析、AB測試、數據運營、數據挖掘和機器學習的需求都很高。如果一個企業不具備有這些技能的人才,技術架構又比較陳舊,意味着他的整個數據賦能平臺比較落後、算法跑不起來,那麼這樣的企業即便在過去十年內積累起非常多的業務經驗,也很有可能在下一輪的競爭中輸給類似今日頭條這樣技術架構及算法體系更加完善的公司。

數據運營其實就是用系統和數據產品的方式去賦能運營,而不是通過人的業務經驗去拍腦子做決定,後面我會講一些案例。

▍什麼是數據驅動?

我們通常在工作中會積累一些經驗,例如向哪些用戶推廣什麼產品,定什麼價格,什麼渠道表有效,那這些其實都是業務經驗,也都是“人工規則”。人工規則往後面進化,就需要通過“統計規則”,通過數據積累的方式把它全部變成數值。這些數值,因爲具有歷史效應,所以經過積累、經過算法挖掘,它能夠自我學習。就是爲什麼我們現在通過機器學習能夠把大量的複雜的、需要人工去處理的這種規則,變成計算機能夠批量處理的自動規則進行處理。

上圖是關於數據驅動的核心觀點。很多工作,例如前端產品界面、功能上線、產品推廣,這些都是人工想出來的事情,但是如何去判斷它有沒有價值,只能回到其本身的指標來看。

數據倉庫、報表平臺、DMP(數據管理平臺),這些是可以讓手工方式,進化到系統自動匹配做事情的一個必要的路徑。

很多產品經理不理解“數據埋點”的重要性,那麼帶來的問題是,如果對埋點這件事情,沒有認真的進行規劃,直接後果將是無法判斷最後產品上線的效果到底是否符合預期。所以很多產品經理就需要在這上面進行比較認真的處理。

關於報表平臺,傳統意義上我們的報表平臺就是可視化,是可以進行多維分析,可以拉報表,可以看到一些指標浮動的平臺。但是大家是否有思考過,應該用怎樣的邏輯去取數?看到了報告之後,我該做什麼?這些問題還是靠傳統的人工決策。但是在一個產品演進過程中,用戶是在變的,市場在變,人在面對很多動態因素的時候,處理能力是有邊界的。

市面上其實有一些不錯的第三方AB測試這樣的工具,比如AppAdhoc和Optimizely。而今日頭條和知乎是自己開發的,它的目的其實不是粗暴地告訴你哪個版本好用,在本質上他是爲了在設想任何一件事情發展過程中,幫你去驗證這件事情到底跟你設想的結果之間相關性有多高,關於相關性和因果的問題後面我會講到。

再談談關於工作流程,這裏可以舉一個例子:汽車工業當年之所以會飛速發展的一個很根本的原因,是因爲像通用這樣的大公司,發明了一種全新的汽車裝配流水線,也是靠這個新流程的出現,實現了大批量的汽車製造。其實互聯網公司也是同理,當我們的業務由於建造了全新的數據產品工具,就會直接促使出現全新的工作流程,導致我們做事方法的根本改變,促使產品更新迭代更有價值。

▍人人都能做的“產品經理”,需要具備哪些能力?

很多人說,產品經理一定要懂數據,我倒不這麼片面地看。我認爲好的產品經理需要有對產品認知能力,還需要具備很強的對商業模式的判斷能力。

產品經理還需要了解技術邊界,對技術瞭解產品經理對數據的處理能力相對就比較強,可以自己用開源工具去搭一個數據分析的內部平臺,如果產品經理對技術瞭解相當深,自己又有動手能力的話,他只要去把概率論和統計學方面的常識補完,對於數據分析的意識都不會差的。

在一個互聯網公司產品會議中,產品經理真正關心的問題,不應該是上圖黃色部分的非常個人化的問題,而是綠色部分的指向業務指標的有效量的問題。

很多產品經理對於企業內部數據代表的任何一個字段含義,可能都不清楚。因爲很多企業在數倉建設時候的字段取名規範和數據類型不容易理解。那麼我們在日常的指標計算的時候,如果對字段含義不理解,或者不瞭解SQL取數的規則,拿到的數據也是有問題的。所以產品經理以及整個運營團隊,一定要對整個企業BI數倉字段的含義經過系統的學習,特別是特定指標差異的原因,以及簡單SQL語句的書寫都要理解。

還有一個問題是,一般來說用平臺跑出來的報表都是固化的,如果一個產品經理需要對新的探索性的事情做出全新的指標做分析的時候,往往需要做開發排期。很多時候這種情況是要在短時間內做出決策的,但當取數、排期、開發報表出來的時候,這個事情就過去了。這也是很多企業面臨的問題,他們想用數據驅動業務,但是發現實際的操作流程有問題,因爲決策的能力沒有能通過數據計算的能力釋放給業務團隊。

▍數據驅動的核心價值

從2016開始,整個移動互聯網流量紅利已經過去了,因爲從整個廣告投放的這個CPC(Cost Per Click,單位點擊成本)來看的話,已經非常貴了。有一個很重要的原因,就是2010年到2016年這大概6年間,因爲iPhone的推出帶動了移動互聯網發展之後,很多企業開始進入這個市場,導致流量被越來越多的人進行瓜分,自然成本就越來越高。

在之前“千團大戰”的時候,剛剛上市的美團能在千團當中生存下來,並且最終能夠拓展更多低頻業務,最後他的酒店間夜量反而超過了旅遊行業的攜程。其實很大一部分原因是由於,美團是一家純技術驅動的企業,它對數據的利用已經到了極致。

數據驅動的重點在於,我們需要通過數據去挖掘用戶的需求,建立內部的用戶畫像及標籤體系。因爲這些系統本身就是你用來挖掘用戶需求的工具,它能夠幫助你去判斷用戶二次下訂單時,我的運營策略應該是怎樣的?以及我上線測試以後,我是否能夠滿足預期的效果?包括髮多少錢的券,發五毛錢呢還是發一塊錢,還是發轉發十塊錢。

還有一個問題是很多人只考慮獲取用戶,但是捋羊毛的用戶其實是很多的,通過優惠手段吸引來的新用戶,之後如果停止發放優惠福利,有可能又會流失掉。如何能夠把真正有價值的用戶吸引過來,並且提升他的LTV(Life Time Value,生命週期價值)呢?LTV這件事情我覺得是所有的產品經理和運營,都需要去考慮,就是每獲取一個用戶,他到底能夠給你公司貢獻多少價值呢?不一定是經濟價值,但是至少是要一個有價值的行爲。

上面這幅圖包含數據驅動的核心價值。在我來看的,第一件事情必須做到的,就是必須要對用戶分析提供堅實的基礎。第二件事情是要對產品設計提供依據。這裏面有兩個層面的問題,一個是傳統用戶調研Persona的部分,另外一個就是用戶畫像的Profile的部分。

第三是優化營銷策略,提供個性化的營銷,個性化營銷手段這件事情其實比較關鍵,這裏面涉及到技術的支持。還有一個就是客戶體驗,因爲很多業務其實不是把用戶吸引到平臺上面之後就完成了,它可能會有一個比較長的服務週期,比方旅遊行業、教育行業,還有一些消費品行業。那麼這裏就會牽扯到客服數據的挖掘,以及整個用戶在業務流程中的閉環指標,比方說教育行業的話,它有上課頻次、完成率、完課率,那麼這些指標都會涉及到一個客戶體驗的部分。

以上這些問題都是數據驅動可以去解決的,但是千萬不要把用戶行爲數據、業務數據、營銷數據、客戶服務數據都分散在各個系統裏面,你一定要把這些數據全部都歸納到同一個數倉裏面,並且清洗完成,然後通過機器學習的算法幫你去賦能做自動化的事情。

▍案例一:如何通過數據整合提升產品轉化率

我先講一個小數據的案例,會給大家一些啓發。下圖是一個高端的定製旅遊網站界面,他的業務就是銷售一些比較貴的海島遊,或者是比較貴的別墅預訂服務。

從廣告營銷來看,他們會投百度廣告。然後會獲得三種不同的轉化,一種轉化叫在線預訂,一種叫在線詢價,還有一種是另外一個產品的在線詢價(因爲他們做廣告的時候,他可能會投不同的關鍵詞,帶來不同的產品轉化)。

可以看到在8月、9月、10月和11月,因爲隨着廣告投放的效果優化,一開始廣告投放成本是上升的,但很快就下來了,並且整體轉化是呈上升趨勢,可以看出投放團隊還是比較仔細的。但是他們也面臨一些問題:

他們整個網站上轉化的目標設置有很多個,在上圖中可以看到,有註冊郵箱、成功預定、詢價提交等等。他碰到的問題是:在轉化漏斗裏面,“選擇房間”這個頁面(6385個用戶),但是僅有14%(899個用戶)進入到下一步“提交信用卡”,這一部分的用戶流失使得團隊成員很困惑,這麼多用戶已經到了選房間的步驟(證明用戶有興趣預定),在這一步流失是非常大的損失。

於是他們就這一部分流失用戶做了分析,所有流失用戶中,有33%是看過是看過入住日期頁面的,還有一部分用戶是在搜索框找不到任何信息之後離開的,還有212個用戶直接從首頁就離開了。但僅僅從頁面的流程設置看,好像沒有什麼問題。

他們又將廣告點擊日期、網站轉化日期、用戶入住酒店Check-in日期、用戶在酒店入住時長等數據放在一起做了進一步分析,最終發現一個問題:用戶點擊廣告的日期,到用戶準備入住的日期,相隔的非常遠。該平臺是一個旅遊度假型平臺,與商旅平臺有一定的區別,用戶一般是帶着探索性的心態爲自己的長假選擇酒店,因此當用戶點開酒店入住日期頁面,發現默認入駐時間相比自己的實際入住時間早很多,便會覺得不符合自己的心理預期而離開頁面。

發現這個問題之後,產品團隊在選擇入住時間的頁面上做了調整,把Check-in默認日期往後放了5-7天,做完這次調整,同樣廣告帶來的流量,在這一步之後轉化率有了明顯的提升。

從以上的例子可以看出,通過簡單的數據整合就能解決一個產品轉化率的問題。用戶行爲數據代表着用戶與每一個業務發生觸點的痕跡,這些痕跡以數據的形式存在於數據庫中,我們可以通過將這些數據整合,完成自動化。比如說剛纔酒店的例子,當這些用戶與平臺頻繁發生業務行爲,如果我們可以進行結構化的數據挖掘,通過用戶行爲偏好分析(例如價格偏好度、出行目的地偏好度、會員等級的偏好度、點評偏好度),一定可以發現其中的相關性。

這些用戶偏好度是一些概率上的數值,這些數值可以在系統形成標籤,通過這些標籤形成系統,做用戶預測,並在準確地在用戶有需要的時候進行觸達,避免一些傳統銷售沒有效率地打電話、發短信對用戶形成干擾。

▍案例二:Google 搜索引擎背後的數據策略

下面的例子是關於搜索引擎這類產品的競爭發展。目前搜索引擎市場除了中國、韓國、日本與俄羅斯等一些地區以外,Google基本是處在絕對壟斷地位的(覆蓋市場高達90%佔有率)。

從美國最開始的競爭來講,Google 最大的競爭對手其實是微軟的 Bing ,相比較於同樣強技術能力的微軟,Google是如何取得更高的市場佔有率呢?在2010年之前,兩家公司的競爭主要在算法、產品和技術方面,但是在2010年之後,Google完勝的原因其實就在於獲得的數據量與數據的完整度要遠遠超過 Bing。主要原因有以下幾點:

1. 優化點擊率模型是搜索引擎很重要的考量指標,相比微軟(除了搜索引擎還有門戶、MSN等業務),Google 從一開始更加專注於搜索引擎業務,因此它的核心優勢在於數據收集能力。

2. 將 Gmail 與 Google 搜索的打通也是其中關鍵的一個策略,當 Gmail 變成全球最受歡迎的email軟件,用戶在其中的文本行爲也都會成爲搜索引擎數據來源的一部分。

3. 2005年 Google Analytics的推出,在當時沒有App的情況下,所有的網站想要判斷廣告流量效果、用戶訪問情況都會去下載Google Analytics,在其中收錄的網站信息也極大地幫助整個搜索引擎獲得了更多維度的數據來源。

當獲取了更完整的數據之後,搜索引擎的本質要做的就不僅僅是大量網頁的收錄、索引、根據結果排序展示,而是通過採集所有的網頁,進行分詞錄入數據庫、清洗,再做網頁排序的預測,使搜索結果更加符合用戶的需求。

其實我們會發現搜索引擎背後就是人工智能的預測,現在 Google 所做的語音識別、翻譯、NLP(自然語言處理),都是將業務積累的規則,變成自動化的過程。

上圖是 Google 大會上的一段 Demo,當 Google Assistant 與用戶交流的過程中其實是有幾個步驟的語音轉化,中間運用到了NLP、ML Ranking等技術,但它的本質是通過觸發對某一段語句情感或文本的內容識別,並通過深度學習預測應該如何提供利於用戶進一步交流的內容,當然整個過程是自動的。

▍用戶畫像與量化指標的相關性

用戶畫像的本質其實就是自動化的過程,它把用戶的性別、年齡、興趣愛好、瀏覽行爲、搜索行爲、訂單等所有數據用機器學習的方式變爲數組,最終形成以API形式對外提供服務的產品。例如今日頭條、淘寶、Netflix這些公司,都是通過用戶畫像的方式完成自動匹配,將個性化的內容推薦給相應的用戶。

下面迴歸到用戶畫像的本質。在一個產品生命週期中,探索期的數據類型還比較粗放,數據量有限,業務線可能會隨時調整,指標體系不夠完整,研發資源也不會重點投入到數據團隊。處在這一類型的產品可能會借用一些第三方工具(GrowingIO、GA、諸葛IO等等),但是通常公司也不太會把業務數據傳給第三方公司,因此在評估產品成果、運營目標、營銷成果的時候還是需要自己去做業務埋點,用產品自身的後臺數據去做業務驗證。

在前期就有數據的情況下,當產品進入成長期,基礎的數據採集數倉幾經是基本具備的,這個時候要做的其實是,將數據進行清洗,洗出針對用戶的靜態屬性和行爲點的數據,然後通過一些線性統計算法放到平臺中。這個時候大家發現,一旦這件事情完成之後的話,運營人員其實是不需要數據分析團隊進行介入的。因爲你已經在一個系統裏面能看到所有的特定業務目標的相關定量數據了。

關於相關性的問題,從上圖的表格中可以看到,一個特定項目裏面,業務系統中有相關的標籤,例如:性別、年齡段、功能使用標籤活躍頻率等等。從這幅圖解讀出來之後,可以發現正相關最高的是“XX功能使用”,而“活躍頻率”的相關程度並不明顯。因此,當運營人員、產品經理可以通過內部系統,將所有標籤用相關性進行拆解,他們就很容易找到相關性最高的那些點,知道做哪些事情、優化哪些功能可以最大程度提高核心指標。

上圖是一個旅遊平臺酒店的用戶畫像案例。通過把用戶與業務屬性相關的數據進行線性迴歸計算,然後把結果偏好映射到了二維表。二維表的數值越高,代表用戶的消費能力越高,最後可以基於這個映射過程做“同類人推薦”。

在大型的旅遊平臺裏,用戶經常會瀏覽酒店下方的評論,這些評論可以通過文本挖掘的方式形成標籤,例如“價格適中”、“安靜”、“牀品好”等描述詞,然後再通過自然語言處理算法形成數據模型,並內置在系統中給每個點評打出用戶標籤,這樣的做法可以影響到新用戶的轉化率。

當一個新用戶在瀏覽過程中,系統可以根據這個用戶的標籤,篩選到類似的點評首先展現在頁面上,會對轉化率有一個很大的提升。

▍通過AB測試驗證相關性

在上面講講到的酒店案例中,在一開始上算法的過程中,其實是不能保證一定可以有效提升轉化率的,因此要做AB測試。

上圖是谷歌的一個工作流程,在任何項目實現之前,都需要先做一個小流量的測試。AB測試是利用統計學原理,把一個產品上的用戶,按照流量的算法進行區分,排除相互干擾的因素進行測試。通常會進行三組,一組是原來的版本,第二組是測試的試驗組,第三組是一個對照組(與試驗組不同的方法,用於排除某一個特定的元素)。

在做AB測試的時候也需要根據用戶標籤做篩選,根據特定用戶羣體做驗證。關於AB測試的70%的結果,很可能是讓你意識到你的實驗結果沒有統計性上的顯著相關性。也就是前面的相關性表格,如果相關性不顯著,可能這個方案就要放棄。我這裏再強調一下相關性因果性的事情,大家可以看下面這個例子:

如果說一個外星人來到地球,發現下雨的時候經常出現雨傘,所以他判斷“因爲有雨傘,所以下雨了”,這個是有問題的。雨傘和雨是相關性的典型例子,用因果來判斷會導致以爲不帶傘就不會下雨的謬論。因果其實也是我們人類在探索產品改版,或者遇到未知問題時候的一種思維模式,我們希望通過A來驗證B是否產生,來判斷A導致B,而往往陷阱就在這個思維模式裏面。

最後再給大家強調一下數據驅動的核心知識點。之前經常提出的增長黑客這個概念,很多產品增長套路我是不建議大家去模仿,因爲每個產品的套路肯定是不一樣的,早年人人網抄Facebook就是一個失敗的案例。我更希望大家可以去做好一開始的數據策略,全面地介入數據採集,例如,數據上報、丟棄策略這些問題,如果是作爲產品經理肯定要去參與的,否則連指標口徑都不知道的話,是沒有辦法判斷最終結果的。

注:以上內容根據嘉賓顧青在數據俠線上實驗室的演講實錄整理。圖片來自其現場PPT,已經本人審閱。點擊“閱讀原文”,獲取作者直播回放。對於數據產品、用戶畫像、標籤體系、AB測試和數據驅動決策等問題,可郵件諮詢顧青(richard#e-bizcamp.cn,發送時請用@代替#),或關注微信公共號e-bizcamp後臺回覆“顧青”,獲取聯繫方式。

作者 | 顧青

編輯 | 趙楠 :[email protected]

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章