我採訪了一位騰訊高級數據分析師

作者:王歡、陳會華

公衆號:數據的力量

數據分析師(或者時髦一些的說法是數據科學家),是公司不可或缺的重要組成人員,一家缺失數據分析師的公司,至少說明這家公司缺少數據驅動的意識,在未來競爭中,一定處於被動。

之前採訪了一位騰訊高級數據分析師 Alice,她 7 年做了 7 個產品的數據分析,都取得不錯效果,同你分享下她對數據分析的思考和理解,希望能對你有所幫助。

1、你爲何選擇數據分析師這個職業?

Alice:我畢業進入騰訊,就從事數據相關的工作,剛開始做大數據主要是數據開發,也就是按需求做數據報表,基本不涉及數據分析;大概在2014年隨着數據開發的成熟,個人也想在大數據方向上往前更進一步,同時產品同學對數據支持產品決策有了更高的要求,於是開始在數據分析上探索。

2、你最擅長的一門分析工具是哪個,爲什麼選擇它?

Alice:做數據分析平時用的最多的是SQL+EXCEL,在大公司做數據分析,這兩個工具用好基本能滿足80%的分析,剩下的20%看具體需求再選擇相應的工具;小數據量建模或者可視化可以選擇python、R,更推薦python,可用的包更多更方便,不想寫代碼的可以用spss、sas建模,Tableau做可視化;大數據量建模用spark+scala;社區分析可以用gephi。

3、你覺得什麼人適合從事數據分析工作?

Alice:這個不好下絕對定論,我覺得你只要對數據感興趣就可以從事數據分析工作,未來數據分析應該是各行各業需要具備的基礎技能,就像大家現在都會使用電腦辦公一樣。

4、你覺得優秀的數據分析師應該具備什麼素質和技能?

Alice:這個問題和上一個問題是有關聯的,雖然從事數據分析工作門檻很低,但要把工作做好我覺得還需要具備以下特點:

1)業務問題轉化能力:將業務問題轉化爲數據問題,如“評估產品是否健康”、“一款直播產品要不要做短視頻運營”等,這些問題都是產品問題或者運營問題,需要進一步將其轉化爲數據問題才能分析,一個好的業務問題是數據分析的關鍵,需要通過深入理解業務再加上自己的思考纔有這樣的思維。

2)數據敏感度:看到的數據不僅是數字本身,而是對應的產品經營狀況度量;數據敏感度不是短期內就能立即提升的,需要長期看數據並結合業務邏輯思考,才能逐步具備數據敏感度。

3)邏輯推理能力:做數據分析很像數學證明題,通常是先有假設,再通過一系列數字證據,來證明假設或者推翻假設,所以需要具備一定的邏輯推理,可以通過閱讀別人的分析報告,學習已有的推理方式來獲得技能。

4)推動策略落地:這是做數據分析至關重要的環節,沒有落地的數據分析都是無用功;在公司內大部分情況是跟產品經理協作完成,爲了保證策略能夠落地,做到兩點很重要:策略要在業務當前的關鍵路徑上;策略需要分解到小團隊或者個人。

5)基本分析工具:這是分析的基礎,在第2個問題有提到,這裏不贅述。

5、在數據分析工作中,你最不願意乾的活是哪些?

Alice:1)重複機械的工作

2)與完全不懂數據的產品和研發同事溝通需求和數據上報

3)自己認爲沒有意義的老闆需求

雖然不願意做的事挺多,但一份工作不可能100%都是自己喜歡的,努力把自己不喜歡的工作做到自動化和規範化,減少這塊的工作耗時,有更多時間做更有意義的事情。

6、在數據分析工作中,哪些讓你覺得最有成就感?

Alice:1)分析報告提出的策略被業務方採納,並有效落地執行,對業務產生很大的商業價值。

2)採用創新的分析方法來解決問題,並進一步沉澱方法論,複用到多個業務場景,最後做到工具化。

7、你覺得數據科學未來的趨勢會是怎樣?

Alice:數據科學和數據分析是兩個不同的領域,在數據分析向更精細工種發展的過程中,出現了兩類更專業的領域:增長分析和數據科學。增長分析主要是以產品增長爲核心的數據分析,要求從業者不僅具備數據分析能力,還要具備較強的產品策劃能力,該崗位往往是產品策劃居多。數據科學顧名思義是讓數據決策更加科學的進行,要求從業者不僅具備數據分析能力,還要具備紮實的統計學、算法建模等能力,數據分析人員居多。數據科學未來可能會在實驗分析、智能分析這些領域的專業性上快速發展。結合網上對數據科學的技能要求以及個人理解列舉了數據科學的能力圖:

8、你覺得增長黑客的方法與傳統的增長方法,有什麼不同?

Alice:增長黑客的方法主要從北極星指標拆解,確定當前增長重點,大家圍繞同一個重點目標,協同各個團隊尋找所有能達到這一目標的增長手段;傳統的增長方法從KPI開始分解,依據每個團隊的職能和資源給其分配KPI指標,進而達成整體KPI完成;

差異點:

1)增長黑客更強調“敏捷和實驗”,增長策略需要通過ICE(impact價值、confidence成功率、easy上線成本)對比評估確定低成本且價值較大的策略,強調要敏捷,所有策略都必須通過上線實驗評估收益,只有正向收益的策略纔會被放量上線,這些在傳統增長方法中較少提及。

2)組織架構差異,增長黑客通常增長策略和研發在同一團隊,便於高效協作;傳統的增長團隊主要是按照職能劃分,運營、策劃和研發在不同的團隊。

共同點:

二者主要差異在增長理念和體系,但在解決具體問題所採用的分析方法上是一致的,用戶生命週期劃分基本一致,主要包括新增、留存、迴流、拉收等,在每個週期通過相似的數據分析方法尋找增長策略;

9、你如何平衡你的工作和生活?

Alice:這個問題我也思考了好幾年,結論是工作和生活無法平衡,只能是取捨,我們能做的就是在工作時間認真工作,非工作時間好好生活,但其實能做到這個也不容易,這也是“知行合一”的一種體現。

10、善良和聰明,你覺得哪個更重要,爲什麼?

Alice:在數據分析工作中,我對善良和聰明的理解:

1)善良是讓嚴謹的數據說話,不帶任何個人偏向去解讀數據。

2)聰明是老闆想要什麼樣的數據,或者你想讓數據呈現什麼樣的結論。

數據本沒有善惡,但在數據解讀的過程中,由於看數據的角度不同或者觀察指標差異,可能會得出相反的結論,這時候就存在矛盾。我覺得這時候就要回到數據本身,尋找更科學的解決方法,摒棄有風險的指標,遵從數據本來的意義。

11、你做了這麼多toC業務的分析工作,你認爲不同業務之間,數據體系有什麼區別(比如遊戲和會員)?數據分析師是否有通用的方法來構建不同類型業務的數據體系?

Alice:數據體系可以粗略劃分爲通用模塊和個性模塊兩部分,下面內容會涉及這兩部分的建設方法。給一個新產品構建完善的數據體系,主要通過以下四個步驟:

1)首先,需要對數據體系有個基本的瞭解,大致包含哪些模塊,便於在設計的時候有針對性;不同產品數據體系從大的模塊上來講基本是類似的,比如規模、用戶健康度和渠道監控等,見下圖,一個產品從灰度到整個生命週期需要觀測的指標大致如下:(部分細節可能與實際產品不符)

2)其次,利用OSM模型梳理自己產品的數據框架,而不同產品的數據體系差異也主要體現在該步驟:

以遊戲用戶留存爲例,對於遊戲業務來說,還有其他業務目標比如收入,也可以按類似方法梳理:

3)結合1、2信息列出自己業務的數據體系

以遊戲爲例,藍色爲通用模塊,未展開描述,綠色爲遊戲業務特有模塊:

4)規劃完成後必須用CSCE準則來檢驗數據體系的合理性:

注意:完整的數據體系指標會比較細,但北極星指標在某一段時間內通常1~2個,另外會有幾個二級指標來輔助北極星指標達成;要注意上述數據體系的設計方法和北極星指標的制定方法不同,曲卉老師詳細介紹過北極星指標的制定方法,感興趣的同學可以去查相關資料。

12、你認爲AI會取代數據分析師嗎,爲什麼?它能夠取代哪部分?

Alice:AI是用來提升數據分析的效率,但無法取代數據分析師。我認爲對於已經具備成熟方法論的老問題,可以通過AI將方法論轉化爲計算機能識別的邏輯,自動幫我們發現問題->分析問題,但最後的策略AI是無法執行的,需要結合業務的思考才能確定落地策略;對於沒有任何方法論的新問題,AI就束手無策了,需要數據分析師來解決,經過不同場景的迭代測試,進而形成方法論,再通過AI自動化。

13、對於想進入數據分析領域的新人,你有什麼建議?推薦哪些書?

Alice:問題4提到的數據分析需要具備的素質和技能都要夯實起來,從體驗產品開始,深入思考再結合數據指標提出問題->敏捷分析->實驗驗證->優化產品,不斷重複這個循環,且持續做方法沉澱。

推薦的書:

  • SQL基礎:《SQL必知必會》;

  • 數據分析:《深入淺出數據分析》、《精益數據分析》;

  • 增長理念和實踐:《增長黑客》作者:肖恩、《硅谷增長黑客實戰筆記》作者:曲卉;

  • AB實驗:《數據驅動設計-A/B測試提升用戶體驗》;

  • Python做數據分析:《利用Python進行數據分析》

  延伸閱讀  

Python:

☞ 這是我看過的最好的Python零基礎Pandas教程(可下載)

☞ 我用 pyhton 做了款可開淘寶店賺錢的工具

☞ 一個超有意思的 Python 綜合能力測試網站

技能GET:

☞ 拍一拍,微信史上最短一行代碼

☞ 立刻、馬上對你的電腦做這三件事!

☞ 專爲技術人員打造的搜索引擎,提升n倍搜索效率!

☞ 一個聚合全網熱點信息的神網站

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章