[數據治理]數據治理領域存在的問題

【個人對數據治理的理解】

匯聚多(數據)源,構建數倉 => 形成 數據中心[資源結構]

數據遷移/融合,統一數據標準,提升數據質量 => 形成 數據中心[資源數據]/數據資產

數據標籤化,數據服務化 => 實現 數據變現 

2不3難:
事後型治理,不一致 / 被動型治理(治理體系被分割),不高效 / 誤區型治理,難聚焦 / 項目型治理,難延續 / 兼職型治理,難落地

​	組織架構 / 數據治理工作流程(制度化) / 線上系統化
【數據治理工作流程(制度化)】執行層面,合理的治理流程是怎樣的呢?
+ 業務架構梳理,界定範圍
+ 拉通業務場景
+ 業務對象和業務元數據梳理(元數據管理)
+ 數據標準和數據規範制定(數據標準與數據質量規則)
+ 總體計劃和方案制定(不同類型問題的解決方案)
+ 執行落地(方案落地)

【線上系統化】針對前期人工積累的數據治理內容,在系統上實現配置、自動監測告警、執行計劃推送,實現數據生命週期管控。
+ 配置表字段的規則
+ 生成質量監控任務
+ 針對不同類型質量任務,推送解決策略

本文根據神策數據聯合創始人 & CTO 曹犟發表的《數據治理中的一些挑戰與應用》主題演講整理而成。

  • 數據治理的概念與重要性
  • 數據治理面臨的挑戰
  • 數據治理與組織架構
  • 數據治理中的應對
[數據治理面臨的挑戰]
+ 多業務系統多數據源的整合挑戰
+ 數據採集技術上的挑戰
+ 用戶隱私與安全挑戰
+ 組織架構與部門隔閡帶來的配合
+ 業務持續迭代中帶來的挑戰
[數據治理的三大原則]
數據治理原則 1:不要先污染後治理,要從源頭控制
數據治理原則 2:數據治理的過程要貫穿到整個業務迭代的過程中
數據治理原則 3:以產品化、組件化的思路來解決,不能依賴於人工
數據源頭不明確,造成數據唯一性、準確性問題

數據採集後,格式不統一,不完整,造成數據完整性、語法問題

數據不及時,造成時效性、準確性等問題

數據共享問題,有些數據仍不能方便地獲得,或不能保障週期性地獲得準確實時的數據

對歷史數據和冗餘數據尚無統一完善的處理辦法
1 有效的高校內部數據標準體系,包括數據標準、管理標準、質量標準等內容,並保證各業務部門、各業務系統能得到落實與管控。

2 完成各業務系統的整合工作。

3 評估數據質量,生成數據質量報告。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章