你與頂級架構師的差距,可能就在這個數據中臺解決方案

最近數據中臺很火,接觸的很多企業都在提這個東西。然而,很多連數據基礎都沒有、仍然處在數據孤島階段的企業,上來就說我今年要做數據中臺項目,這實際上是因爲大家都在追熱點,而沒有真正搞明白這個名詞的含義。

很多頂級架構師都喜歡談中臺,他們口中的中臺和你瞭解的中臺又有什麼差距呢?往下看。

首先,國內的數據中臺興起,大多是因爲阿里巴巴的馬老師提出的”大中臺、小前臺”的口號。所以,我們先來看看阿里對數據中臺的定義。

你與頂級架構師的差距,可能就在這個數據中臺解決方案

 

數據中臺是什麼

數據中臺是指通過數據技術,對海量數據進行採集、計算、存儲、加工,同時統一標準和口徑。數據中臺把數據統一之後,會形成標準數據,再進行存儲,形成大數據資產層,進而爲客戶提供高效服務。

這些服務跟企業的業務有較強的關聯性,是這個企業獨有的且能複用的,它是企業業務和數據的沉澱,其不僅能降低重複建設、減少煙囪式協作的成本,也是差異化競爭優勢所在。

廣義的數據中臺包括了數據技術,比如對海量數據進行採集、計算、存儲、加工的一系列技術集合,今天談到的數據中臺包括數據模型,算法服務,數據產品,數據管理等等,和企業的業務有較強的關聯性,是企業獨有的且能複用的,比如企業自建的2000個基礎模型,300個融合模型,5萬個標籤。它是企業業務和數據的沉澱,其不僅能降低重複建設,減少煙囪式協作的成本,也是差異化競爭優勢所在。

數據中臺的價值

1、數據複用。

浙江移動已經將2000個基礎模型作爲所有數據服務開發的基礎,這些基礎模型做到了“書同文,車同軌”,無論應用的 數據模型有多複雜,總是能溯源到2000張基礎表,這奠定了數據覈對和認知的基礎,最大程度的避免了“重複數據抽取和維護帶來的成本浪費。

曾經企業的數據抽取就有多份,報表一份,數據倉庫一份,地市集市一份,無論是抽取壓力、維護難度及數據一致性要求都很高。同時,統一的基礎模型將相關業務領域的數據做了很好的匯聚,解決了數據互通的訴求,這點的意義巨大,誰都知道數據1+1>2的意思。

2、沉澱業務模型

在企業內,無論是專題、報表或取數,當前基本是煙囪式數據生產模式或者是項目制建設方式,無法形成標準化統一業務模型,無法沉澱和共享也就無法迭代生長,從而造成模型不能真正成爲可重用的組件,無法支撐數據分析的快速響應和創新。只有在迭代生長中的業務模型才能從最初的單一字段,逐漸完善形成爲企業最爲寶貴的統一模型資產和統一數據資產。

以報表爲例,企業報表成千上萬的原因往往也是沒有沉澱造成的,針對一個業務報表,由於不同的業務人員提出的角度不同,會幻化出成百上千的報表,如果有報表中臺的概念,就可以提出一些基準報表的原則。

比如一個業務一張報表,已經有的業務報表只允許修改而不允許新增,自然老報表就會由於新的需求而不斷完善,從而能演化成企業的基礎報表目錄,否則就是一堆報表的堆砌,後續的數據一致性問題層出不窮,管理成本急劇增加,人力投入越來越多,這樣的事情在每個企業都在發生。

你與頂級架構師的差距,可能就在這個數據中臺解決方案

FineReport做的報表

3、數據驅動業務創新

我們都知道,以往的業務決策,大多是憑經驗拍腦袋的,現如今,數據的價值和重要性不言而喻。企業的管理者在做決策時,越來越想要先看數據。所以,好的數據基礎,是決策和創新的加速器。而現在市場競爭如此激烈的大環境,不但需要企業做出正確的決策,效率和執行力也是關乎存亡的,數據中臺即是數據創新效率的保障。

研究過機器學習的都知道,沒有好的規整數據,數據準備的過程極其冗長,這也是數據倉庫模型的一個核心價值所在,比如運營商中要獲取3個月的ARPU數據,如果沒有融合模型的支撐,得自己從賬單一層層彙總及關聯,速度可想而知。

在如今的互聯網時代,企業都在全力謀求轉型,轉型的關鍵是要具備跟互聯網公司一樣的快速創新能力,大數據是其中一個核心驅動力,但擁有大數據還是不夠的,數據中臺的能力往往最終決定速度,擁有速度意味着試錯成本很低,意味着可以再來一次。

數據中臺、數據倉庫、大數據平臺的關鍵區別是什麼?

認可了數據中臺的價值,我們自然是想要去快速搭建,然後真正去規劃建設的時候,我們會發現,數據中臺的建設和數據倉庫、大數據平臺是有重合的,這就需要我們充分理解三者的區別。

你與頂級架構師的差距,可能就在這個數據中臺解決方案

 

綜上,我們會發現,數據中臺是在數據倉庫和大數據平臺的基礎上,將數據生產爲爲一個個數據 API 服務,以更高效的方式提供給業務,本質是一個構建在數據倉庫之上的跨業務主題的業務系統。

所以,我們會發現,不論要做哪一個數據項目,數據纔是核心,統一數據倉庫、主數據是基礎。只有打通各業務系統的數據孤島,將數據標準、口徑、模型、存儲統一,形成具備完整性、規範性、一致性、準確性和及時性的高質量數據,才能逐漸釋放數據價值。

如何進行數據價值變現

分爲幾個階段:首先,把數據管理起來,形成統一數據資產(數據資產不等同於數據,數據資產是唯一的,能爲業務產生價值的數據);

你與頂級架構師的差距,可能就在這個數據中臺解決方案

 

其次,將數據可視化,在我們將數據自動化、可視化的呈現出來的過程中,我們能夠充分釋放數據的信度、效度、準確度方面的價值。

這也是爲什麼越來越多的傳統企業在進行數據項目規劃時,通常會先做一個叫做”管理駕駛艙”的東西。其本質就是,通過上層呈現所要保證的一致性和規範性,倒逼下層的數據管理、數據治理,從而逐漸開展數據分析輔助決策、數據驅動業務等。數據可以告訴決策者一些潛在的規律,以數據來證明或判斷決策。

第三個階段,很多時候,即便數據質量非常完備了,但因爲依賴於統計學的數據分析只能對歷史的、以往發生過的事情做解釋,所以往往總是會慢半拍。而數據挖掘、機器學習,這些近幾年才流行起來的技術,可以充分利用海量的數據,通過算法模型去挖掘數據背後的規律,從而輔助我們提前預測或者個性化推薦。

以往我們只會用數據來證明我們歷史的決策對錯,現在我們用數據來引導我們做出對的決策。基於數據資產催生的人工智能,將數據進行再融合形成新的數據,源源不斷給我們提供新的業務視角,讓我們不斷創新、不停去嘗試。

當我們逐漸依賴數據機器人的指令,形成數據服務思維和習慣,讓業務與數據形成循環活起來,讓它成爲業務的一部分,同時讓機器智能成爲決策環節,運營就可以智能化,即智能化的數字業務系統。

最後,想必對於各種企業要做數據項目,想要構建數據中臺,我們可以形成一個優先級順序,以管理駕駛艙爲驅動的數據倉庫建設——>面向各業務主題的全面數據治理——>非結構化數據+海量數據加速的大數據平臺——>把數據變成個性化服務的數據中臺。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章