什麼是數據中臺?

寫在前面的話:不要被技術嚇到哦 ,本文儘量寫的白話,致力爲從事大數據的運營、諮詢規劃、需求以及想學習大數據的入門者提供知識分享@……@

導讀:本文將闡述:爲什麼要建設數據中臺,什麼是數據中臺,數據中臺具備什麼樣的能力。採用什麼技術來實現

一、爲什麼要建設數據中臺

因爲在當今互聯網時代,用戶纔是商業戰場的中心,爲了快速響應用戶的需求,藉助平臺化的力量可以事半功倍。不斷快速響應、探索、挖掘、引領用戶的需求,纔是企業得以生存和持續發展的關鍵因素。

目前,數據體量、產業規模以及雲計算高速發展所推動的基礎設施成本都已不再是問題,大數據能否創造真實的商業價值和回報是大數據企業真正關心的核心問題。

過去,所有大數據企業都在做項目,並沒有更多資源把能力沉澱成產品和平臺。比如很多可共用的數據服務沒有服務化、產品化,很多產品總是做重複的動作。

TalkingData創始人兼首席執行官崔曉波認爲,互聯網公司之間的戰役已經結束了。所有企業主戰場不在線上而在線下,不管是互聯網巨頭還是產業巨頭都在思考如何利用互聯網、數據和相關技術的能力改變線下產業。而且,選擇合作伙伴應該遵循一個原則:願意真的開放數據,願意給實體產業賦能。

二、什麼是 數據中臺

數據中臺是指通過數據技術,對海量數據進行採集、計算、存儲、加工,同時統一標準和口徑。

今年,馬老師(馬雲)說過,數據中臺成爲大數據行業的熱門概念,它最先是從阿里引出的,“很多人會把數據比作“石油”,阿里巴巴要成爲全球電子商務的“水電煤”。我們現在搭建的數據中臺,就是希望扮演“發電廠”的角色。”

數據中臺把數據統一之後,會形成標準數據,再進行存儲,形成大數據資產層,進而爲客戶提供高效服務。這些服務跟企業的業務有較強的關聯性,是這個企業獨有的且能複用的,它是企業業務和數據的沉澱,其不僅能降低重複建設、減少煙囪式協作的成本,也是差異化競爭優勢所在。

數據中臺

數據中臺建設的基礎還是數據倉庫和數據中心,並且在數倉模型的設計上也是一脈傳承,之所以我們現在處處推崇數據中臺建設及應用,一個是因爲數據中臺確實有過人之處,另一個是這套模型在阿里體現了巨大的應用價值。

 

三、數據中臺能力

數據資產管理

盤點數據資源、規劃數據資源、獲取數據資源,並將所有數據資源進行完整呈現;通過元數據信息收集、數據血緣探查、數據權限申請授權等手段,解決"有哪些數據可用"、"到哪裏可以找到數據"的難題,並且提升數據資源的利用率。

數據質量管理

數據質量就是保障數據正確性的工具,主要包括這麼幾部分:一是支持準確性校驗規則,二是支持雙表校驗,三是輸出校驗報告。

數據模型管理

數據模型管理,主要是爲解決架構設計和數據開發的不一致性,是爲了約束平臺使用者的表名、字段名的規範性,架構師從工具層合理的進行模型分層和統一開發規範,包括2部分,一個是規則配置,另一個是對錶名、字段名的定期校驗。

構建標籤體系

對用戶、產品、客商、營銷各主題域進行標籤提取,將其特徵數字化,爲後續進行精準 營銷和用戶畫像提供必要條件。着重分析當前需要但是無法獲取到的指標,描述使用不便的指標,分析問題原因,繪製數據供應鏈條;

數據應用規劃及實現

數據中臺策略的基本理念是,將所有的數據匯聚到數據中臺,以後的每個數據應用(無論是指標和分析類的,還是畫像類和大數據類的)統統從數據中臺獲取數據,如果數據中臺沒有,那麼數據中臺就負責把數據找來,如果數據中臺找不來,就說明當前真沒有這個數據,數據應用也就無從展開。

四、數據中臺構成

“數據中臺”一般包含以下幾個部分:

1、數據倉庫:用來存儲數據的,結構性數據、非結構性數據等,還有離線數據和實時數據等;

2、大數據中間件:包含了大數據計算服務、大數據研發套件、數據分析及展現工具;

3、數據資產管理:按照阿里的體系應該分爲垂直數據、公共數據和萃取數據3層;

五、總結

數據時代帶來的挑戰不僅僅是數據量的爆發式增長,更重要是如何管理好、治理好、利用好這些數據,顯然傳統的大數據建設方法論無法滿足需求。

如果把大數據建設工作比如蓋高樓的話,那麼大數據平臺開發和管理工具(數棧)就是打樁機、挖土機、推土機、塔吊...,過程中嚴苛、繁瑣、體系的開發、治理、分析建設方法論(數據中臺)就是樓層規劃、戶型設計、房屋建造....,數據服務就是業主個性化的裝修。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章