數據分析師在數據治理流程中承擔的角色

點擊上方 藍字 關注我們


數據是企業的核心資產,數據治理也是企業的核心工作之一,運用好數據能夠爲企業賦能。而在爲企業賦能的過程中,數據分析師起到了至關重要的作用。作爲初學者,理解數據治理流程能夠幫助我們更好地認識數據部門各個崗位之間如何協同配合,更加清晰地認識數據分析師的崗位職責。很多初學者認爲數據分析師的工作只有分析,看完本文你會對數據分析師的崗位職責有更深的認識!

 




什麼是數據治理





數據治理是逐步實現數據價值的過程,具體來說,數據治理是指將零散的用戶數據通過採集、傳輸、儲存等一系列標準化的流程變成格式規範、結構統一的數據,並有嚴格和規範的綜合數據管控;對這些標準化的數據進行進一步加工分析成爲具有指導意義的業務監控報表、業務監控模型以幫助業務進行輔助決策。

在數據治理流程當中,涉及到了前端業務系統,後端業務數據庫系統再到業務終端的數據分析,從源頭到終端再回到源頭,形成的一個閉環負反饋系統。同樣地,在數據治理流程當中,我們也需要一套標準化的規範來指導數據的採集、傳輸、儲存以及應用。





數據治理流程介紹




數據治理流程是從數據規劃、數據採集、數據儲存管理到數據應用整個流程的無序到有序的過程,也是標準化流程的構建過程。根據每一個過程的特點,我們可以將數據治理流程總結爲四個字,即“理”、“採”、“存”、“用”。


 

 

1.理:梳理業務流程,規劃數據資源

對於企業來說,每天的實時數據都會超過TB級別,需要採集用戶的哪些數據,這麼多的數據放在哪裏,如何放,以什麼樣的方式放?這些問題都是需要事先進行規劃的,需要有一套從無序變爲有序的流程,這個過程需要跨部門的協作,包括了前端、後端、數據工程師、數據分析師、項目經理等角色的參與。

 

2.採:ETL採集、去重、脫敏、轉換、關聯、去除異常值

前後端將採集到的數據給到數據部門,數據部門通過ETL工具將數據從來源端經過抽取(extract)、轉換(transform)、加載(load)至目的端的過程,目的是將散落和零亂的數據集中存儲起來。

 

3.存:大數據高性能存儲及管理

這麼多的業務數據存在哪裏?這需要有一高性能的大數據存儲系統,在這套系統裏面將數據進行分門別類放到其對應的庫裏面,爲後續的管理及使用提供最大的便利。

 

4.用:即時查詢、報表監控、智能分析、模型預測

數據的最終目的就是輔助業務進行決策,前面的幾個流程都是爲最終的查詢、分析、監控做鋪墊。這個階段就是數據分析師的主場,分析師們運用這些標準化的數據可以進行即時的查詢、指標體系和報表體系的建立、業務問題的分析,甚至是模型的預測。

 

 

 



數據分析師在數據流中承擔的角色




數據治理流程涉及到多部門多崗位的分工協作,數據分析師在這個流程中也承擔了重要的角色。數據分析師的職責真的不止是分析,除了分析之外,數據分析師需要參與到數據規劃、數據採集過程中,而在數據應用過程中也需要完成指標體系、報表體系的建設以及部分臨時的數據查詢需求。

 

 

1.數據埋點

數據分析師要對業務進行分析,分析所需要的數據需要通過埋點來獲取。分析師參與到數據規劃、數據採集的過程中,可以更快地拿到數據,減少數據等待時長,有利於提高分析的效率。

舉個例子來說,假如現在用戶流失很嚴重,業務提了個需求讓分析師幫忙分析下用戶流失前的第n步都做了什麼?但是,碰巧用戶流失前第n步的事件log沒有記,那麼作爲數據分析師沒有數據分析也無從下手,只能給研發提出埋點需求,在下個版本進行數據埋點。那麼這樣一來,分析的週期就會延後一個版本。如果分析師參與到數據埋點這項工作中來,諸如此類的事情大部分都是可以避免的。

 

2.指標體系及報表體系建設

數據的終極目的是定位業務問題,輔助業務決策。而指標體系就是監控業務問題,定位業務問題的好幫手。所以,指標體系的建設也是數據分析師的重要工作之一,好的指標體系能夠直接反映業務問題,同時能夠幫助數據分析師快速定位業務問題,以輔助業務進行決策。

 

3.商業智能分析

數據分析師當然也少不了分析,包括了各類活動效果分析、版本變化分析、用戶分析、流失分析等等。一份好的分析報告能夠給業務的發展提供多種思路,也是分析師最重要的價值體現。

 

數據分析師在數據治理流程中需要撰寫數據埋點文檔、搭建數據指標體系、報表體系以及分析業務問題,每一個技能都會在後續的文章中更新!

 

 

參考文章

https://www.infoq.cn/article/ubch5bdk2twgdo5x*uzn


如果您覺得我們的文章還不錯,請分享,點贊,再看,一鍵三連!


END


Excel技巧相關文章持續更新中,歡迎加入數據人專屬交流羣

指標體系|四個模型教會你指標體系構建的方法

2021-01-04

指標體系|從中國人口數據談指標體系構建

2020-12-28

數據人必會的Excel|掌握32個Excel小技巧,成爲效率達人(一)

2021-01-08

數據人必會的Excel|學會這些日期函數,能夠解決80%的工作難題!(文末送書包郵)

2020-12-16

數據人必會的Excel|掌握這些文本函數,讓你的工作如魚得水!

2020-12-23

數據人必會的Excel|掌握這些邏輯函數,讓公式嵌套更簡便!!

2020-12-30


 

分享數據知識,成就數據理想



點個在看 你最好看




本文分享自微信公衆號 - 實時流式計算(RealtimeBigdata)。
如有侵權,請聯繫 [email protected] 刪除。
本文參與“OSC源創計劃”,歡迎正在閱讀的你也加入,一起分享。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章