數據百問系列:數據研發大多數工作都是在提數,如何破局?

0x00 前言

問題

數據研發大多數工作都是在提數,如何破局?

話題整理者:未期,某不知名大學透明本科生,GIS背景。畫過地圖,寫過代碼,熱愛統計。目前在數據科學的道路上緩慢前進,希望與大家共同學習~

問題描述

聽上去很高大上的大數據研發工程師/數倉倉庫工程師,日常工作很多時候就是給產品/運營跑一下數據,他們要什麼我們就提供什麼,感覺枯燥且乏味。想請教一下,有沒有什麼更好的辦法,既可以提高工作效率,又可以達到技能上的提升,最好能舉幾個例子。

0x01 討論內容

討論1

vlvd

  1. 深入瞭解業務訴求,想得比對方更深入,避免因緯度不夠重複抽取數據

  2. 抽象常用數據緯度指標,搭建數倉表,通過數據平臺工具配置報表,可以節省一部分常用報表統計

  3. 培養產品運營自己提數的能力,腳本寫好給她們,他們如果只是改些渠道日期範圍,自己改下就好了

  4. 主動挖掘業務潛在需求,引用行業專業合理的數據分析統計方法,比他們更早考慮數據變化,提升自己的思考力,業務對你們信任感增強,你可以主導需求,零碎的訴求可能會減少些

提數這個過程是無法避免的,主要看如何把重複工作工具化

討論2

Qing

  1. 培養數據使用方自助提數的能力

  2. 提供更好用的中間表

  3. 提供更好用的數據提取和分析工具

  4. 儘量提高自己在分析方面的專業度,這樣,提數類無價值的活就會被安排給別人了

討論3

搞數據的成爲提數工具人是沒辦法避免的吧,我覺得可以有兩個方向發展吧。

  1. 固化模型,減少重複工作,業務翻來覆去看的東西應該是差不多的。

  2. 發掘新工具,學習下新工具的使用。最近公司用了metabase,幫業務培訓下如何使用之後,從很多提數工作中解放了。

討論4

居士家族:虛線居士

作爲數據從業者,提數是最基礎的工作,算是瞭解業務的開始,大家貌似都很排斥提數,我也有那麼一點,不過我是個小菜雞,我還做不到每個提數需求都可以很快很完美的呈現給需求方,我還需要思考,有時提數對我來說還是一種成長(當然這種想法對於多年工作的大佬們可能不太適用)。提數是避免不了的,我們高級經理都還會做這種事情,我們並不覺得提數多低級。只不過長時間工作中除了提數就是提數的話,還是需要嘗試改變下吧,和領導溝通工作內容問題,要不就換一份工作(其中換工作可能會有點不好,但是親身經歷,同事基本天天提數,想做別的工作公司領導不給批,後來一組人除了他都忙得不得了,疫情開始就被辭退了)。

討論5

居士家族:東方居士

古牧兄的觀點我覺得挺好的,引用一下:

  1. 80%的通用性需求可以固化到產品上;

  2. 系統思考提前準備,應對需求方的散點式需求;

  3. 避開外行;

  4. 站在對方的角度,思考對面會提出什麼樣的有價值問題。

討論6

居士家族:憋七居士

我這邊和你一樣,我提了兩年的數,支持過衆多產品、運營、分析師、算法、以及各級領導,我來說下我這邊是怎麼做的:首先不能逃避問題,要去解決問題

  1. 前期提數,工作低級,要做的是理解業務,和學習業務邏輯,我覺得這點非常重要,我現在會參與業務產品的指標規劃,因爲我的優勢是給多個業務線出過需求,知道每個業務線看指標的角度,可以給出更合理化的建議,這不光是理解業務,也是在打通你在公司的人脈和話語權

  2. 理解業務,沉澱數據,把數據都沉澱到數倉中,這一點也很重要,這就是要用到數據倉庫能力了

  3. 開放hue或其他查詢平臺,提供運營,分析師,產品進行數據查詢,我們這之前分析師的人要比數倉多好幾倍,我們的做法就是開放平臺,培訓sql,這裏需要注意報表權限和資源管控

  4. 數據可視化,業務方提需求看數據,是用做數據分析,還是支持工作系統,數據分析、大盤監控,那就開發平臺產品;支持其他業務系統數據,那就開發接口,此時需要數據開發的能力

這是我經歷的變革,現在數據提取不需要數據倉庫的,但是倉庫人員一定要緊跟業務變動,配套設計數據治理方案,也隨着業務發展改變倉庫模型設計。所以我現在可以滿足任何一個項目或者需求到我這裏,我可以給出合理的解決方案,以及張口就來的業務邏輯,還有ceo要緊急數據,也能完美支持,所以遇到問題,解決問題,不要慌,都有這個過程的。

討論7

居士家族:影子居士

抗拒提數是很正常的。工作模式上單調乏味,技術上長時間接觸同一種模式。同時對業務一知半解。我將工作分爲技術和業務兩個方向。取數只是技術的很小一部分,但和其它更側重技術的方向相比,優勢在於它會牽涉到很多業務邏輯。想不成爲取數機器,如果從技術深挖,你可以開發查詢平臺(針對常用的多個報表),沉澱數據,好好利用數倉的優勢,同時給業務人員提供SQL培訓(巨有用)。上面也說到,數據和業務銜接緊密,如果從業務方面深挖,多和運營產品或者財務交流(不懂就問),看看他們的模式是怎樣的。要知道,技術是實現業務的方式,同時也是業務的保障。

討論8

居士家族:人造居士

如果僅僅只是迴應業務端的需求,提一點數據,當然沒有太多的提高,關鍵是怎樣理解業務的核心邏輯,以及如何進一步將這些核心點呈現出來。比如一個線下業務,那麼銷售人員所提交的有哪些信息?有哪些信息的埋點?需不需要增加/減少?通過這些信息埋點,可以提示我們什麼?有沒有進一步挖掘的空間?比如產品的品類/銷量/客單價之間的分佈、關係。又比如渠道之間的產品分佈差異有沒有提示渠道本身成交的邏輯和方式有差別?這些差別有沒有綜合或者優化或者相互借鑑的地方?這些可能都需要與業務端反覆溝通,才能真正理解業務閉環,進而進一步理解真正的商業邏輯和商業邏輯的實現途徑。有了這樣的理解,哪怕換一個公司,也是大有可爲的。

0xFF 總結

本期討論來源於數據從業者常有的困惑,參與討論的朋友們結合自身的不同工作階段、經驗的思考總結給出了非常詳盡的觀點,下面是討論內容的簡單總結:

  1. 強化認知,理解業務和學習業務邏輯

提數作爲數據從業者的基礎任務,是接觸業務的開始。前期的提數工作更重要的是理解數據背後的業務邏輯。面對業務人員提出的需求,積極思考,構建更完善、有深度的分析流程 ,提高自己在工作中的參與感,更完美地滿足需求,理解業務閉環 。這無論是對個人成長,還是提高在公司的話語權,都大有益處。

  1. 固化模式,將通用性需求移交他人

在對業務有了一定程度的理解之後,總結出一套相對固定的模式來滿足通用性需求,移交到業務方或者固化到產品上 ,將自己從大量重複性的提數工作中解脫出來。

  1. 沉澱數據,注重數據模型的設計

對於數據倉庫工程師而言,要充分利用數據倉庫的優勢,沉澱數據,抽象常用數據指標,設計出更靈活的數據模型來支持多樣性的分析提取需求 。同時,緊跟業務,對倉庫模型設計做出相應變動。

  1. 發掘工具,開發自助產品

對數據研發工程師,側重工具的建設。一方面,開發貼近業務相關的自助產品,提供SQL培訓,提高業務人員自助提數的能力 ;另一方面,針對業務方提出的不同需求,如果是支持數據可視化、大盤監控,就開發平臺產品;如果是提供其他業務系統數據,就開發相應接口。

  1. 主觀能動,主動挖掘潛在需求

如果一直被動地滿足需求,最終不可避免淪爲提數工具。在工作過程中,要時刻保持主觀能動性,例如:深入思考業務訴求,站在對方角度,提前系統地準備以應對不時到來的零散性需求;培養自己的思考力和發現問題的能力,主動給業務方提供思路,持續跟進效果並給予及時反饋,儘量做到主導需求,而不是被需求支配

以上就是本期問題討論的內容啦!

在本期討論中:

虛線居士獲贈《Python極客項目編程》

憋七居士獲贈《商業智能數據分析》

人造居士獲贈《實用機器學習》

歡迎大家積極提出問題以及參與後續討論!

討論地址,也可以在 閱讀全文 中查看:https://t.zsxq.com/FEYvzvf

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章