企業爲什麼要建設數據分析平臺?應該怎麼建?

大數據時代,幾乎每一個企業都對數據分析平臺趨之若鶩,尤其是在今年疫情爆發之後,更多的企業主意識到了數據所具有的的極大商業價值,以及其作爲支撐企業信息智能化的無形資產。

 

通常來說,企業內部的運營和業務系統每天會積累下大量歷史數據,一些企業最多是對一些零散的數據進行淺層次的分析,真正的海量數據其實並沒有得到真正有效的分析利用。

 

同時,隨着系統的不斷增加和積累,沉澱在系統深處的數據也更加難以提取和整合,後期的報表展示和可視化分析也就成了空殼應用。

 

所以數據分析平臺的建設就十分必要了,一方面它可以匯通企業的各個業務系統,從源頭打通數據資源,另一方面也可以實現從數據提取、集成到數據清洗、加工、可視化的一站式分析,幫助企業真正從數據中提取價值,提高企業的經營能力。

 

 

1

 

 

神祕的數據分析平臺究竟是什麼?

 

通俗一點說,數據分析平臺就是將公司所有的數據進行進行收集整理,包括系統數據、業務數據等等,在統一的數據框架下實現對數據的挖掘和分析,最後通過可視化的手段進行數據展示。

 

因爲數據分析平臺涉及的組件衆多、功能複雜,如何將其有機的結合起來是其建設過程中最關鍵的核心。我們不妨以某集團的數據分析平臺爲例,來看一下具體的數據分析平臺架構是什麼樣的:

 

 

在搭建數據分析平臺之前,要先明確業務需求場景以及用戶的需求,通過大數據分析平臺,想要得到哪些有價值的信息,需要接入的數據有哪些,明確基於場景業務需求的數據平臺要具備的基本的功能,以上圖爲例從下至上可分爲四個層次:

 

數據採集層:底層就是各種數據源,主要是對企業底層數據的採集和解析,將零散的數據整合起來,包括企業的核心業務數據、用戶數據、日誌數據、集團數據等等,通常有傳統的ETL離線採集和實時採集兩種方式

 

數據儲存和處理層:有了數據底層的數據,然後根據需求和場景的不同進行數據預處理,儲存到一個合適的持久化儲存層中,比如說OLAP、機器學習、數據庫等等

 

數據分析層:這裏就要用到BI分析系統,比如FineBI,如果是傳統的數據挖掘還有SPSS,這一層主要是對數據進行加工,然後進行深層次的分析和挖掘。

 

數據應用層:根據業務需求不同劃分出不同類別的應用,主要是對最終的數據進行展示和可視化,如上圖的數據報表、儀表板、數字大屏、及時查詢等等。

 

總結來說,企業對數據、效率要求的逐步提高,也給大數據提供了展現能力的平臺,企業構建大數據平臺,歸根到底是構建企業的數據資產運營中心,發揮數據的價值,支撐企業的發展。

 

 

2

 

 

數據分析平臺真的有必要嗎?

 

在企業在進行數據分析平臺建設之前,經常會有一個疑問:企業數據系統每天都在正常跑數據,業務系統也都正常穩定,那我們還需要數據分析平臺嗎?

 

答案是當然需要,在實際的企業數據管理中,業務系統往往不是單一的,而是多源的。業務人員看似每天都在用業務數據,但實際上彼此的數據都是相互割裂、不打通的,如果想要實現數據分析,就要從多系統中取數,然後手動整合分析,這個顯然是不能靠人力就能做到的。

 

這就叫做數據孤島,這個問題的難點在於需要跨數據源進行分析,不同數據源之間的對接很難打通;其次,企業的數據一定是海量的,有的還需要二次加工,如果沒有數據分析平臺的支撐很難實現。

 

 

另外從企業業務系統的角度看,我們如果把數據分析的工作直接單獨放在業務系統上,一來系統的性能支撐不了這麼耗費資源的事情,系統壓力會很大,二來隨着數據的積累,單獨的業務系統很難承受大數據量的處理,所以重新構建一個大數據處理平臺就是必須的了。

 

所以,一個數據分析平臺的出現,不僅可以承擔數據分析的壓力,同樣可以對業務數據進行整合,也會不同程度的提高數據處理的性能,基於數據平臺實現更豐富的功能需求。

 

 

3

 

 

數據分析平臺建設流程

 

數據分析平臺的建設流程基本上可以從數據分析流程來理解,比如數據採集、數據整合、數據加工、數據可視化等等,一般的大數據平臺都會包括這些流程,叫做一站式大數據平臺。

 

這裏要注意一點,很多企業通常把基礎數據平臺建設錯以爲是一站式數據平臺,二者最大的區別就在於架構上有沒有實現業務探索式分析。

 

一站式數據平臺架構有很多類型,現在比較流行的是自助式分析,也就是主動式的企業數據分析平臺,讓業務人員直接參與數據分析,藉助於BI平臺充分探索分析數據,並能將龐大的任務分解爲小任務處理。

 

下面就以FineBI爲例,簡單梳理一下自助式數據分析平臺的具體建設流程:

 

1、數據採集

 

企業數據從產生到應用依次經過了數據產生、數據存儲與處理、數據應用三個階段,由業務系統產生的數據經過ETL加載到數據倉庫,並在數據倉庫中進一步加工處理後進入BI工具,最後通過BI工具實現數據分析與可視化展示。

 

 

要想頂層應用良好,那麼底層的數據建設就相當重要,所以自助式數據分析平臺建設的第一步就是要搭建數據倉庫。如上圖所示,一般來說,數倉在技術上採用三層架構設計:ODS、DW、DM。

 

  • ODS全稱是Operational Data Store,即操作數據存儲。它是最接近數據源中數據的一層,數據源中的數據,經過抽取、洗淨、傳輸,也就說傳說中的ETL之後,裝入本層。本層的數據,總體上大多是按照源頭業務系統的分類方式而分類的。

  • DW全稱是Data Warehouse,即數據倉庫,是數據倉庫的主體。在這裏,從ODS層中獲得的數據按照主題建立各種數據模型。

  • DM全稱爲Date Market,即數據集市或寬表,也可稱爲或DWS。DM層爲面向最終應用的主題層,一般依據前端報表/業務包需求進行設計,對DW層明細數據進行多表關聯,用於提供後續的業務查詢,其主要作用是提升報表查詢性能。

 

在經過ETL清洗後的數據就是我們建立BI系統所需要的數據,這時候就需要通過FineBI連接企業的數據倉庫。

 

其次,FineBI中是通過業務包的形式進行數據存儲,IT人員基於業務需求將數據進行分類管理,通過設立表間的關聯關係和多路徑設置來進行數據整合。

 

 

這樣就得到了企業業務系統的底層數據,但是這些來自不同系統的數據指標基本是混亂的、沒有意義的,所以下一步就要對數據進行加工。

 

2、數據加工

 

我們整合過的數據往往也是異構數據源中的數據,因此要先對關係數據進行初步的處理,比如說指標的篩選等等,將處理後的表存到業務包中作爲數據分析的基礎,這就叫做自助數據集。

 

而FineBI實現自助分析的方法也是通過自助數據集的方式,它就相當於一個數據容器,IT將清洗好的數據放入數據集中,如果業務覺得基礎數據不滿意,或者是需要進行跨表聯用,就可以自主建立數據集,自己進行數據的加工處理。

 

 

IT人員創建了數據連接和業務包以後,爲業務人員構建BI基礎的數據模型,分析用戶配置好關聯關係,分配好權限和設置好數據更新的頻率,提供一層可供業務理解的基礎模型。然後業務再在數據集中對這些數據進行進一步的加工處理,比如篩選數據、過濾數據、數據分組彙總、數據行列轉行等等,經過加工後的數據就是業務進行分析的最終數據了。

 

 

4、數據分析和展示

 

得到了清洗後的數據,業務就可以進行自助式分析了。FineBI 的可視化探索分析,是面向分析用戶,讓他們能夠以最直觀快速 的方式,瞭解自己的數據,發現數據問題的模塊。業務人員只需要進行簡單的拖拽操作,選擇自己需要分析的字段,幾秒內就可以看到自己的數據。

 

 

在這一步我們還可以對可視化組件進行OLAP分析操作,比如FineBI如果想要實現國家地圖與省份地圖的切換,就可以使用鑽取功能,將某個特定分組數據按第二維度繼續細化的方式。

 

類似的還有組件放大、組件復原、查看組件過濾條件、組件維度切換、組件跳轉、聯動設置、組件懸浮、組件標題、組件導出Excel、組件複用等。

 

 

 

4

 

 

總結

 

總的來說,無論是大數據平臺的流程,還是業務分析平臺的建設,必須要注意保證平臺的性能:大數據分析平臺的性能一定要保證高效,在數據量激增的情況下可以支撐海量數據分析。

 

最後,在大數據時代,企業的數據分析平臺架構必然向着分佈式、可擴展及多元化發展,這樣才能通過對數據流程的梳理,去推動公司梳理整個業務體系。

歡迎關注我的公衆號“商業智能研究”,私信回覆“資料包”,即可領取大數據、數據中臺、商業智能、數據倉庫等6G精華資料!

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章