本文是【技術瑣話公益直播】4月28日晚分享嘉賓徐楨虎在線直播中主題《數據中臺初探與應用實踐》內容整理,內容有刪減調整,直播回放見之前的分享。
1 爲什麼需要數據中臺
當企業發展到一定規模時,數據是否能夠創造價值顯得尤爲重要。如果沒有從業務的角度對數據進行規劃,再多的數據也沒有用。一個企業業務與數據雙中臺的戰略地位是相輔相成的,需要打造數據與業務的閉環。
- 數據增值 :對數據做統一規劃、管理、深度挖掘,實現數據到資產的增值;
- 數據流通 :高價值數據資源的整合、積累、流通,提升數據處理能力;
- 業務創新 :打破技術隔閡,構建智能化技術引擎,提高業務效率和創新能力。
數據中臺的核心價值爲優化現有業務和實現新業務的轉型,打造數據驅動的智能化企業。
業務價值 :
- 以客戶爲中心進行精細化運營
- 以數據爲基礎支撐商業模式創新
- 打造持續增值的數據資產
技術價值 :
- 應對不同數據處理的需求
- 對數據資產進行標籤化應用
- 快速複用數據服務
- 快速定位數據血緣鏈路
2 什麼是數據中臺
傳統數據倉庫,第一次明確了數據分析的應用場景應該用單獨的解決方案去實現,不再依賴於業務的數據庫。這個階段主要是IBM、oracle的產品的黃金年代。但是進入互聯網時代後業務發展太快,數據量劇增,傳統數據倉庫逐漸沒落。爲什麼傳統數據倉庫效率這麼低?自頂向下建模。
數據湖(Data Lake)是一個以原始格式存儲數據的存儲庫或系統。以google發佈的三篇論文爲基礎實現的hadoop開源項目的出現大數據平臺是面向數據研發場景的,覆蓋數據研發的完整鏈路的數據工作臺。
大數據平臺像一條設備流水線,經過大數據平臺的加工,原始數據變成了指標,出現在各個報表或者數據產品中。
數據中臺的核心,是在企業數字化戰略的基礎上,利用一套技術標準構建的共享、安全、標準、統一的數據服務。
恩門建模(自頂向下)因爲是從數據源和主題域開始構建,構建成本比較高,適用於應用場景比較固定的業務,比如金融領域,冗餘數據少是它的優勢。金博爾建模(自底向上)由於是從分析場景出發,適用於變化速度比較快的業務,比如互聯網業務。
嘉賓觀點:數據中臺是各個企業獨有的一種戰略選擇和組織形式,不存在數據中臺這樣的一個能對外直接售賣的產品。
3 哪些企業需要數據中臺
嘉賓認爲:
企業有一定的信息化基礎,但存在較多的業務數據的孤島,需要數據整合分析
企業有數字化轉型需求,需要通過精細化運營提升效率
企業是跨多個領域業務線的集團架構,有豐富的標籤維度和大量的數據應用場景
四、什麼時候要建數據中臺
4 什麼時候要建數據中臺
5 建數據中臺的成本
五、建設數據中臺的成本
6 如何建數據中臺
六、如何建數據中臺
嘉賓觀點:可見是數據資產化,可用是數據產品化和服務化,可運營是要打造數據價值轉換的閉環
建議原則:
儘量兼容原各業務線系統,避免推倒重來(開源兼容)
先拿新的業務線作爲試點,再大面積推廣(快速試錯)
先使用的業務線,提供更高的容錯度和激勵(鼓勵創新)
7 建數據中臺職責由那個團隊承擔?
8 封面傳媒數據中臺應用實踐
嘉賓核心觀點
人的因素往往最難推動,因爲涉及到很多團隊的利益,還涉及到能不能找到一些有經驗的人來做這個事情。
嘉賓介紹:
徐楨虎,西南交通大學計算機碩士,專業方向是數據倉庫與數據挖掘
封面傳媒 總經理助理兼數據研究部總監
技術委員會召集人、人工智能研究所執行所長
專注領域:數據中臺建設、媒體AI應用落地
TGO鯤鵬會 成都分會成員
2050大會講師
四川省青聯委員
本文轉載自公衆號技術瑣話(ID:TheoryPractice)。
原文鏈接: