對話 CTO〡聽 GrowingIO CTO 葉玎玎講無埋點數據分析的業務理想

​​專欄介紹

 

「對話 CTO」是極客公園的一檔最新專欄,以技術人的視角聊聊研發管理者的發展和成長。

本專欄由ONES 的創始人&CEO 王穎奇作爲特邀訪談者。王穎奇曾參與金山軟件 WPS、金山毒霸等大型軟件的核心開發工作;2011 年創立了正點科技,旗下產品正點鬧鐘、正點日曆在全球用戶過億;2014 年,王穎奇在知名美元基金晨興資本任 EIR,並以個人身份參與十餘家公司的管理諮詢工作;2015 年,王穎奇創立 ONES,致力於提供企業級研發管理解決方案。

 

摘要

 

創立之初,GrowingIO 以無埋點技術切入市場。爲了讓數據平臺可以幫助客戶做深度的用戶轉化、留存分析,GrowingIO 花了三年多時間去打磨產品。

 

正如 GrowingIO 聯合創始人&CTO 葉玎玎所說,真正去做一個 SDK 來採數據其實很容易,但是要做 SaaS 服務,要針對不同用戶的不同寫法去做通用型的開發,還要考慮應用開發本身的一些易變化特性等等,這些都需要很強的技術支持。

 

葉玎玎曾在網易杭州研究院從事工程數據庫相關工作,2009 年接觸 SaaS,2015 年到 GrowingIO 負責核心產品研發。

 

本期對話 CTO,我們請到了 GrowingIO 聯合創始人&CTO 葉玎玎。關於 GrowingIO 產品如何支持業務發展,以及數據分析產品的歷史演進,葉玎玎談了談自己的看法。

 

 

產品做給業務端

 

穎奇:很高興 GrowingIO 的 CTO 葉玎玎同學能接受我們的訪談,我覺得可以先大概講一下 GrowingIO 在技術方面的一些特長。

 

葉玎玎:OK,如果要研究 GrowingIO 的技術,一定要先了解它的形態。GrowingIO 是一家雲的公司,做 SaaS 的公司,所以我們所有的客戶數據的採集都會在雲上。

 

目前我們第一個技術特點就是外界所熟知的無埋點,自動去採集用戶從打開應用或者打開網站到離開的所有行爲數據,這個行爲數據通過可視化的定義方式去展現。其實這會涉及到你如何去理解客戶端的實現,無論是對瀏覽器本身的實現,還是對於 iOS 或者安卓操作系統的實現,這裏都需要很多黑科技的東西。去了解它的實現後才能更好地在上層去研究怎麼做無埋點的邏輯。所以這個是我們在過去三年花了很多時間去研究的東西。

 

真正去做一個 SDK 來採這些數據其實很容易,但是要做 SaaS 服務,如何針對不同用戶的不同寫法去做這個通用型的開發,並且是插件,包括這裏面還要考慮如何去應對應用開發本身的一些易變化特性等等,這裏需要做很多東西。

 

所以我們在這個過程中自己也用了很多方法,通過算法、模型、機器學習等方式,考慮怎麼去讓前端採集到的數據跟後端用戶的數據邏輯之間更好的匹配,所以這個就是外界所熟知的 GrowingIO 的無埋點。但本質上另外一個挑戰在於,當有這麼大數據量進來的時候,我怎麼去處理數據?我相信 GrowingIO 數據量在國內應該算蠻大的。

 

穎奇:因爲無埋點本身是沒有篩選的來進行數據採集,所以肯定會有很大的數據量。

 

葉玎玎:一方面是這個,另外一方面也在我們數據系統本身。舉個例子,我們每天可能有個兩三千億條的消息,我相信大部分公司都達不到這個量,這是第一點。第二點是,GrowingIO 有一些幾個億 DAU 的客戶,單體客戶幾個億,再加上雲端有這麼多其他的客戶,怎麼更好地處理、存儲、查詢,都是一個很大的挑戰。

 

穎奇:那對比市場其他競品,在數據量這方面,GrowingIO 有沒有一些技術上的先進性?

 

葉玎玎:是有的。 GrowingIO 目前有一個很多客戶認爲很方便的功能——指標維度的多維交叉,實現任意去拖拽指標維度,瞬間出圖。舉個例子,你要進行基於人的指標維度任意交叉的時候,GrowingIO 是可以快速出結果的。具備這些屬性的用戶,然後做過哪些事情的用戶,在歷史上的任何一個時間點,能立刻知道這羣人,立刻計算出來他們有誰。這個東西在之前的數據系統裏面相對來說是比較少的。大部分數據系統,無論是 T+1 還是實時,還是一個小時這種,它都是基於事件的處理。

 

穎奇:這就是說分析過程上你們應該是做了更多事情的。

 

葉玎玎:我覺得是在用戶畫像本身,就是我們如何去更好的找到一批用戶。然後這個過程包括,如果你找一個其他的用戶分析系統,你想要看留存,或者說要去做轉化路徑,要找到哪些優化點,那核心其實就在於對於用戶之間羣體的對比。

 

對單一人羣去做分析其實很容易,但是一旦要將用戶之間對比各種東西,然後又要達到非常快的響應效果,這個其實是其他競品很難做到的。這裏最核心的差別是說,因爲我們一直是做給業務端的,就是產品運營等等,所以我們的要求就是他們能非常簡單的從我們的分析工具裏面去得到結果。

 

穎奇:所以 GrowingIO 在無埋點等技術上有哪些關鍵特點呢?

 

葉玎玎:無埋點肯定是我們一個關鍵特點,因爲使用其他產品的話,你可能需要自己去梳理所有東西,我們是讓那個業務直接可以自己去做。然後第二點是基於這個能力上來說,本身我們會演變出來新的一層能力,我們能快速做實驗。比如我現在想要一個東西,這個時候我不是找研發去幫我做打點,而是直接可以看到結果。我當時自己爲什麼覺得 GrowingIO 很值得做,就是因爲我之前用其他數據分析工具時,陷入到數據採集-使用、採集-使用的整個不停的輪迴之中,這個過程中,大量時間其實被浪費在前端的採集和處理這一塊,真正進入到核心的產品邏輯的迭代和產品的改進的時間是比較少的,而 GrowingIO 就不會有這樣的問題。

 

高效能遠程工作

 

 

穎奇:我瞭解到您之前是有做過遠程團隊的工作,您覺得遠程工作這樣的方法在中國現在是不是真正能夠去很好的來實行?

 

葉玎玎:我個人判斷相對是比較難的,它必須變成兩種模式。遠程工作要麼就是全員遠程,這個事情反而是可以做的。因爲全員遠程意味着大家每個人都接受了,我必須要爲了我們的效率提高付出額外的努力,然後爲了降低我的溝通成本,我要做哪些事情。我覺得這個是非常關鍵的。但這裏面如果存在大部分人不遠程,某一兩個人、兩三個人遠程的情況的話,這個就會變得非常尷尬。因爲很多時候最高效的溝通肯定是面對面溝通,然後在面對面溝通過程中,有一個人如果在遠程的話,那很多時候他其實不知道其他人在聊什麼,因爲除了語音、視頻以外,還有一些肢體語言等等,然後聊着聊着很容易的一點就是大家把遠程的人忽略掉了。

 

所以我個人的建議是如果全員遠程,這個是 OK 的。但是這種模式是否能演變出來非常快地去響應變化,這是有一些潛在風險的。所以這個意味着整個團隊的認知需要達到一定的高度,然後整個團隊爲了達到更高的效率,更好的溝通,願意付出什麼。如果你去評估這兩點之後,覺得這是自己可承受的風險,那可以選擇。如果對一個創業公司的話,我覺得這個可能是比較難的。但是如果對於一些看着需求做事的公司來講可能是沒有任何問題的,因爲這個過程中無非是我怎麼把項目管理做的更好。或者還有很多公司選擇了另外一種模式,其實不算遠程,就是一個多地的辦公室。

 

穎奇:前一兩年的時候,因爲一些效率工具的出現,大家都說可能未來是遠程工作的時代,人會越來越依賴工具。但是現在我們越來越覺得,真正工具剛需的來源不是因爲遠程工作,面對面的時候我們也是需要工具的。

 

葉玎玎:我覺得工具的核心不是爲了解決遠程的問題,而是人是在流動的,是不一定都在一起的。比如風車到最後服務的團隊可能是在一個 office,但是因爲大家都出去了,所以在這個過程中怎麼去分配工作,怎麼去溝通等等,(工具本身)還是解決類似這類問題。

 

圍繞用戶做分析

 

 

穎奇:您怎麼看待中國數據分析行業的過去、現在、未來?包括過去一代二代的數據分析產品,現在的數據產品,可以來分享一下您的看法。

 

葉玎玎:我覺得最早的應該不叫分析工具,叫統計工具。像 CNZZ 也好,像百度統計也好,做流量的一些統計,核心是在流量層面。

 

然後再往下,大家會說光是統計還不行,要進入分析,要了解一下我的用戶整個情況是怎樣的,那這個時候會演變出來第二代的數據分析產品,就是基於事件的。因爲每個事件都會對應到人,既有事件的模型又有用戶的模型,這個用戶到底做了哪些事情,然後去篩選用戶,這個是第二個階段。

 

目前大部分的工具應該也在這一層,包括在 2010 年左右出來的友盟、Talking Data 爲代表的一系列工具,當時它們承載的很多可能就是流量統計的功能,但是它們也有事件模型。然後再到下一代,從事件本身到開始運營用戶的生命週期了,就是到用戶這一層。

 

穎奇:到用戶這一層了,就是會把它組合起來看。

 

葉玎玎:是的,我通過事件去更具體的去看一個用戶,核心圍繞着用戶來做分析,不是核心圍繞着事件來分析。所以我們所有的人的模型在整個數據分析裏面就會成爲第一個關注點,這個是很重要的。然後再往下的東西也跟這個時代相關,因爲現在有很多機器學習,你要去做個性化,這個過程中,你怎麼去更好的基於機器學習來做東西,無論是從各種推薦引擎,或者說各種的計算模型,這樣演變出來比如做 alert(提醒)、anomaly detection(異常檢測),那這些又會進入到下一個階段。但是這裏的所有都是基於你的數據層是乾淨的。數據這一層要有一個好的基礎,不然想着跳到下面步驟的話是很難的。

 

穎奇:在您剛纔講的用戶精準個性化的一些業務上,我們現在看到的這些數據平臺更多是幫忙分析,你們會有一天能夠真正走到業務中去嗎?比如說可能會提供一些數據的接口,或者提供一些非常精準的畫像,每一個客戶最終都會跟真正業務端的服務對應起來。

 

葉玎玎:其實我們現在就在做了,我剛纔提到,理論上我們的客戶主要打的還是業務端,比如產品、運營,他們用我們系統就在做這件事情,真正走到業務裏面去,他們在我們系統上去定義各種東西。舉個例子,我們可以讓系統找出來,比如昨天註冊了,看了 Demo,但是沒有繼續去做創建項目的人。這羣用戶篩出來以後,針對這些用戶可以去做觸達。然後比如在做哪些事情的過程中,你到底要給他一個什麼樣的動作,這些東西是我們在幫我們客戶做的,所以它其實是非常業務化的。

 

穎奇:能否給大家介紹下您的個人職業經歷?

 

葉玎玎:我之前在網易杭州研究院工程數據庫相關的組裏面工作了一年半,2015 年之後在做 GrowingIO。中間有幾個節點,第一個是我最早遠程是 Freelancer,那時候更多是幫美國的一些創業者去做 0 到 1。然後 09 年到 12 年,我從自己研發的這個點更加往外擴出去,負責產品研發,做企業社交這一塊。但是我是從 09 年開始真正去接觸 SaaS 這個行業,然後接觸 to B 這個方向。

 

09 年的時候,我們非常看重怎麼去做實時 Web,因爲它在 09 年的時候其實沒有太好的解決方案,但那個時候我們爲了自己做的東西,就做了很多技術上的突破。然後到做協作工具也是,就是怎麼把用戶體驗和當時實施的技術更好的打包成一個方案表給到用戶。然後到 14 年底開始做無埋點,也是在當時非常新的一個東西。

 

12 年底到 13 年又做了另外一個蠻好玩的事情,就是 Teahour,一個技術播客。我覺得當時 Teahour 對很多剛工作一兩年的或者在剛畢業要找工作的那羣人給了很多方向性的指導。

 

穎奇:您之前一直在做程序員,也一直在做自己的項目,那最終變成一個這麼大公司的 CTO,中間有什麼特別重要的一些轉變,或者您覺得比較關鍵的時間點或者里程碑,經歷了之後就變成一個 CTO 了。

 

葉玎玎:因爲我從 06 年畢業的時候就開始創業,無非是一開始創業相對來說團隊的人數可能比較少,然後會經歷一個團隊從小變大的過程。我會非常關心用戶到底是怎麼想的,對我來說,爲什麼我對數據分析很感興趣的一點,在於我會嘗試通過這個去理解到底用戶在用我的產品的時候他心裏的想法。所以我覺得很核心一點是,我自己是在思考到底這個業務和產品應該怎麼來做的,所以我覺得我跟大部分的技術不太一樣,我會很容易在用這樣的視角去思考。

 

穎奇:非常棒。最後可不可以推薦一些您最近看的認爲比較好的書給大家。

 

葉玎玎:我看的書會比較更加偏意識形態一點,更加偏管理一點。我最近一直在看《賦能》,《賦能》這本書核心講在現在這個時代,你到底應該有什麼心態,應該怎麼去更好的發展等等。

 

穎奇:好的,今天有很多收穫,非常感謝。

 


想要更好更快地發佈產品?請掃描二維碼瞭解更多。或訪問http://ones.ai。

想要更好更快地發佈產品?請掃描二維碼,或訪問http://ones.ai瞭解更多。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章