從技術到管理,數據人如何開展工作?

目錄

  • 0x00 先溝通

  • 0x01 再建模

  • 0x02 想分析

  • 0x03 自動化

  • 0xFF 做一名合格的TL

0x00 先溝通

我一直有個觀點,數據倉庫&數據分析,是一個跟人打交道的工種,而不是技術。

筆者從事2B方向的數據倉庫工作,之前面試過不少的同學,有一些機靈的,會在面試之前,簡單問一問崗位的內容,我一般也會照實回答。在得知工作內容是2B之後,一些人就表示了明確的拒絕,更希望從事的工作與2C方向相關。儘管我比較討厭這種情況的出現,但我會表示尊重,因爲搞清楚自己想從事的工作方向,比工作機會更重要。

爲什麼會說工作方向更重要?因爲大多數數據人,所從事的工作內容,都是與業務相關的。並不是說技術方向不可以,而是純技術的崗位,招聘的人數遠比業務崗位少得多,而且要求高得多。出於現實的考慮,從事業務方向的開發,就是大多數人的通常選擇。業務開發,說到底,就是要實現業務價值的,而業務價值,並不僅僅指導出報表,也不僅僅指做一個架構完美的數據倉庫,而是要產出切實的業務價值。技術人通常比較羞澀,不願意過多的跟人打交道,那麼產品/運營,甚至是老大的很多想法,就很少去了解,到了彙報的時候,往往被質疑的懷疑人生,也就不足爲奇了。

工作方向,說到底,就是你感興趣的,並且能夠有動力去跟別人聊下去的愛好。

我並不想多談業務價值該怎樣實現,成功的人思考問題的方式都是類似的,而底層的碼農做事的方式卻各有各的風格。但實現業務價值的一定要多跟別人交流,思維多碰撞才能產生火花。即便是你在某個領域深耕多年,不交流也很難繼續跟上時代的發展。

因此,先錨定自己的興趣點,並不是指技術,而是指從事的業務方向。在這個基礎上,多溝通、多交流,數據人才算是開展了數據工作的第一步。

0x01 再建模

建模的作用,是用來描述清楚當前的業務場景。

建模通常是數據倉庫應該做的事情,而數據倉庫通常是面向過去的,以描述數據的流動性爲目的。數據倉庫有幾種經典的數據模型:範式模型、維度模型、DataVault。在實際的工作中,不管採用哪一種模型,能夠把當前的業務場景講清楚就可以了。

例如你所從事的行業是2C方向的,那麼維度建模就很合適,因爲維度能夠很好的描述歷史狀態的變化情況,用事務事實表和快照事實表,能夠滿足絕大多數的建模場景。但假如你從事的是2B的行業,那麼單一的模型就可能適應不了,例如企業管理,通常主數據是以範式建模的方式組織的,或者是星型模型,這時候基礎模型就要根據數據庫來構建。但很多分析的場景又需要關聯其他的數據,例如財務、法務數據,這時候又需要做一些維度建模來分析公司的運行狀況。

但建模也不是絕對的,建模本質是你對於商業運行模式的思考,對於數據在其中流動方式的總結。

0x02 想分析

分析的作用,是用來產出有價值的洞察報告。

例如我們在構建宏觀矩陣的時候,描述的是公司業務線和對應的數據狀況,其行、列一般對應着業務主題和數據主題。業務主題包括了公司所對應的業務線佈局,例如電商、遊戲、視頻、應用商店、新聞資訊和瀏覽器等;數據主題根據抽象程度和視角的不同,對應了相應的業務形態數據,例如曝光、點擊、消費、播放、分享等,又可以通過這些原生的行爲進行衍生計算,例如留存、活躍、流失等。

我們每次在啓動一個新的項目前,都需要做一個行業的調研,瞭解業界關於這個項目的解決方案,在分析具體的數據前,其實也要有對應的調研過程。數據分析與公司的商業模型比較強綁定,數據分析應該以數據的關聯能力爲突破口,將複雜業務過程,以透傳和洞察能力展示出來,匹配到管理者的期望值中。

可以說,數據來源於業務,並反作用到業務中,還是逃不出商業價值的牢籠。

0x03 自動化

自動化,也可以叫做平臺化&流程化,是指把已經成熟的分析/計算方法,做成一套固定的方案,後續有類似的場景能夠再次使用,提升業務價值複用的能力。

自動化的目標,不僅僅是爲了節約時間,更是爲了將已有的方法論固化下來,後人能夠在前人的基礎上,做進一步的迭代升級。業務所普及的Hadoop等框架,本質也是後人不斷提升前人的工作成果,最終形成一套完整的生態。

以數據中臺爲例,它的發展有三個階段:描述階段、分析階段、預測階段。剛開始的時候,一無所有,快速把現有的數據進行整合和建模,就非常重要,這個階段能夠理清楚業務細節就是最大的勝利。在此基礎上,隨着業務邊界擴張、業務邏輯逐漸統一的前提下,多進行橫向或者縱向的數據對比工作,能夠切實解決一批業務價值的問題,並將分析和解決的思路沉澱下來,這裏就有了初步自動化的基礎。最終當數據流完全數字化及標準化後,引入模型,建立預測機制,將提升業務價值的能力逐步標準化,並且配置成自動流程,這時候數據的智能化場景,就逐步的體現了出來。

0xFF 做一名合格的TL

技術人有兩條發展路線:一條是走技術,一條是走管理。其實,在數據的場景下,大多數的技術能力,在阿里P7階段就已經學會了,而更深一步的技術能力,每提升一小步,所付出的精力和時間,都是之前的一大步,很多人就被迫走向了管理路線,也就是TL。但是,TL所面對的場景非常複雜,管技術、管團隊、管業務,特別忙是一定的,又反向迫使很多人望而卻步,真正的變得迷茫起來。

TL的核心職責,其實是可以跨團隊組織工作,這其中,要想讓別人信服,頂層架構、發展分析、落地策略、團隊管理、KPI制定、領域驅動、技術驅動、穩定性建設、質量建設、準確性建設、分佈式系統、陌生領域知識…… 要學習的內容太多了。數據人,很多時候,走到這裏,就30多歲了,中年危機也來了。

其實,我們放平心態,把工作想象成一場長跑,階段性跑的快不是勝利、跑跑停停也註定落後,最合理的方式,其實是一點一點提升自己,按照自己的節奏,不被工作和生活所帶跑偏,堅持下來,你還是比大多數人跑得快。

儘管TL很難,但這是大多數人最切實可行的路線,就像高考一樣,過了獨木橋,又是一道美麗的風景線。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章