數字化轉型中的自動化大數據治理

本文轉自微信號EAWorld。掃描下方二維碼,關注成功後,回覆“普元方法+”,將會獲得熱門課堂免費學習機會!本文轉自微信號EAWorld。

當今,數字化正在各行業快速發展,醞釀着一場巨大的變革,許多企業將會經歷前所未有的改變。在數字化轉型的道路上,數據是上層建築和質量的基石,而數據治理在提升企業數據質量的道路上扮演重要的角色。

目錄:
一、數字化是企業精細化管理的必由之路
二、數據治理就是自動化的數據生命週期管理
三、企業數據治理執行建議

一、數字化是企業精細化管理的必由之路

圖片描述

我們現在身處一個虛擬時空交易與現實時空交付的數字化時代。

數據正發揮着越來越重要的作用,數據將驅動企業業務運營,我們通過數據去發現機會或定位問題的根源,從而從根本上解決問題。

圖片描述

從發展趨勢來看,未來的企業必將成爲數字化的企業,數字化轉型將成爲企業核心戰略,而在此過程中數據治理則是轉型道路的必由之路,它能提升企業數據的整體質量,規範企業管理數據的動作。

圖片描述

普元在多年的項目實踐過程中,發現企業在做數據治理的過程中存在着五個痛點,分別是:

企業數據摸底不清晰
缺乏數據治理落地體系方法
缺乏有效的支撐工具
數據整改週期長
系統建設各自爲戰,數據關聯度不足,甚至割裂

圖片描述

企業中有價值的數據是散落在不同的業務系統中的,由於信息化進程和階段的不同,業務系統都是採用急用先建的策略進行。要從企業萬千雜亂的數據中理出價值密度高的數據,人工、無體系的管理方式在數據膨脹的環境下已心有餘而力不足,企業需要自動化甚至智能化的手段去解決數據的問題。在多年的實踐中我們發現,自動化是大數據治理的關鍵因素。

作爲數據密集型企業,銀行一直是國內數據治理的排頭兵,有數據治理相關的政策要求,也有數據強化管理的要求。下面我們舉幾個銀行的案例:

圖片描述

先看某大型知名銀行的案例。在這個案例中,我們幫助客戶實現了自動支撐數據標準構建、自動規範系統數據模型、自動構建企業數據地圖、自動實現數據協同變更、自動執行關鍵數據檢核等全面自動化的數據生命週期管理,大大提升了對數據管理的力度。

圖片描述

再來看一個城商行的案例,該城商行通過自動化的企業數據地圖構建、自動實現數據協同變更、自動執行關鍵數據檢核,保障了數據中心對數據的統一管理,推進了變更統籌管理、降低了源頭業務系統在數據結構變化過程中對分析類應用的影響,從而大大提升了該行IT項目羣的整體管理水平。

由於時間和篇幅的原因,我們沒對電信、政府、製造業、航空業、物流業的案例進行介紹,但在普元實施這些行業客戶的時候,無不是通過自動化的手段去解決數據治理問題。

我們認爲,數據治理其實是圍繞數據生命週期的不同階段,開展對數據規範、管理和整治活動的集合。由於數據在企業中存在的形態是瑣碎多樣且無體系的,企業必須用整體的思路、體系化的管理策略,使用自動化的方式去解決數據管理的問題。

二、數據治理就是自動化的數據生命週期管理

我們從不同行業的數據治理實施項目中提取了五種可執行的自動化手段,來解決數據生命週期中不同階段的數據治理問題。

這五個手段分別是:
自動支撐數據標準構建
自動規範系統數據模型
自動構建企業數據地圖
自動實現數據協同變更
自動執行關鍵數據檢核

圖片描述

1.自動支撐數據標準構建

自動支撐數據標準構建的意思是,企業能在在數據生命週期的規劃和標準規範階段,能通過工具來自動構建數據標準。

數據標準是企業的語義字典,不僅對企業數據架構,數據分類,數據特徵進行了全方位的描述,還對業務活動和業務系統建設給出了數據架構層面的的指導性建議。它相當於一個綱領,用來規範信息系統的建設,並且協同業務和技術。

一般企業構建數據標準,需要參考同業、引用國家標準、考慮企業數據現狀。但我們發現標準和企業實際情況脫節是經常會出現的問題,造成標準無法落地或落地困難,所以數據標準制定過程中一定要充分考慮企業的數據現狀。我們認爲要在摸清企業數據現狀的基礎上再構建數據標準。

圖片描述

構建數據標準要從自動化的數據資產梳理開始。通過元數據管理工具自動摸清企業有哪些數據,在什麼地方,如何存儲,歸誰使用,誰在運維,體量如何,數據含義是否明確,被誰關聯引用等,在這些都明確的基礎上,自動對元數據進行歸集和分類,將分類結果經過甄別評審後歸集到定義好的數據標準分類體系上,整個過程在線上完成,實現數據標準構建的自動化支撐。

圖片描述

從整體統籌的的角度講,與傳統數據標準的構建方式相比,自動化構建數據標準有幾個好處:

一是數據標準是從企業實際數據環境中發掘出來的,制定的標準有現實依據;

二是關鍵的、核心的共享級數據明確了出處,在什麼部門、在什麼系統、在什麼數據庫中、歸誰管理和負責一目瞭然,在進行數據共享的時候減少了數據分析時間,提高了工作效率。

三是針對存量的核心數據進行了數據標準映射,在標準制定過程中可以映射存量系統關鍵數據,在管理和使用上明確了這些數據和標準的關係。

2.自動規範系統數據模型

企業信息化正從分散化業務處理系統向平臺化業務系統轉變,如何落實數據標準化,發揮數據標準統籌規範的價值是一件不容易的事情。在數據生命週期的開發實施階段,自動規範系統數據模型變得很重要。

圖片描述

自動規範系統數據模型在數據生命週期過程中起到了承上啓下的作用,也是數據標準化落實的關鍵階段,是元數據事前管理的重要環節。

對於新增系統和存量系統來說,自動規範系統數據模型的方式也不同。在信息系統建設初期,業務模型、邏輯模型、數據模型要能在線上設計完成,並且設計的過程中能引用企業信息模型(非金融)或數據標準(金融),以此來達到規範模型的目的;

而對於存量系統,我們可以使用自動化的元數據採集能力,自下而上反向生成存量系統的數據模型,如上圖所示。

圖片描述

雖然在線設計系統模型在一定程度上保證了數據標準或企業信息模型的有效落地,但系統運行是一個持續的過程,投產後的系統元數據隨時都有可能發生變化,所以需要定期自動從生產環境中採集元數據和設計態中的元數據進行比對糾偏,保證設計和投產的一致。

3.自動構建企業數據地圖

企業組織是一個整體,描述的企業活動的數據應該也是一個整體。企業可以通過元數據管理工具,將企業所有元數據自動採集到一起,並在自動抽取元數據的過程中建立不同載體與跨載體的數據關係,形成一張反映企業現狀數據的關係網,我們通常稱這張網爲“數據地圖”。

通過數據地圖,在運營管理上能統籌看待數據,全盤考慮數據架構,提出數據治理目標,從根本上解決問題。

圖片描述
圖片描述

企業數據地圖的構建必須是自動化的,通過自動化才能準確獲取企業信息系統中的元數據信息以及元數據間的關係信息,數據地圖的脈絡分析讓每個數據的在企業的數據鏈條的位置和數據價值變得清晰可見,通過數據地圖還能查詢數據的技術屬性、業務屬性、管理屬性、安全屬性、稽覈屬性等,當然也能知道數據是否遵循了企業數據標準規範。

圖片描述

以上提到的數據間的流向關係在企業信息系統是真實存在的,我們選用合適的元數據工具能方便得到。但數據的關聯關係一般是邏輯上的。比如:核心系統、信貸系統、基金系統、網頁系統、理財系統都存在客戶號,要基於客戶號獲取這些系統中客戶實體的相關屬性信息,將會是一件不容易的事情。因爲這需要知道相關係統在數據上的邏輯關係,而邏輯關係一般在跨部門,跨系統間是沒有在數據庫表層面建立的,所以在做數據分析的時候需要一種自動化的手段來給這些數據建立關係。

我們基於知識圖譜技術構建企業數據間的關聯關係,首先基於企業元數據信息,通過自然語言處理、模式識別等算法,以及業務規則過濾,實現實體對象提取;然後以本體的形式表示和存儲;最後利用智能搜索、關聯查詢手段,爲最終用戶推薦數據關聯關係。有了知識圖譜的支持,基於元數據的自助數據服務開發就變得很簡單了。

4.自動實現數據協同變更

在數據生命週期的使用階段,企業業務系統建設的步伐深化,數據需要在不同的系統當中流轉和交互,一些平臺類的系統開始出現,如ODS、倉庫、集市、大數據等,企業運營決策也依賴數據的整合,這期間面臨的一個主要問題就是數據全鏈路協同變更。

在數據鏈路上,任何一個點上數據結構的變化必將影響其他節點上的數據,我們需要一種自動化的能力實現全數據協同變更。下圖是一個典型的案例場景,供大家參考。

圖片描述

自動的全局數據協同變更包含兩層意思,

一是在數據鏈路上的任何一點發生數據結構的變化,如字段長度、字段類型等,會自動通知數據鏈路上的相關部門或責任人;

圖片描述
二是在數據作業異常後,會自動的通知作業依賴鏈路上相關的部門或責任人。

另外, 流程在數據管理工作中起到串聯和推動的作用,數據管理工作是企業級的一個大的基礎工程,涉及的部門、系統、人員較多,因此常態化的數據管理離不開流程驅動,引入流程化機制,能規範跨系統,垮部門的數據工作協作。

5.自動執行關鍵數據檢核

數據治理的核心目標是通過優化數據結構,規範數據定義,完善數據使用流程等手段來提升企業數據質量,我們所制定的組織、角色、工作方法都是圍繞這個目標來設計的。企業要通過自動化的手段重點監控核心數據,如監管類的數據,核心決策類指標數據等。

圖片描述

數據標準是衡量企業數據質量好壞的準則,對企業關鍵的數據檢核應該來源於數據標準規範要求。在上面的分享中,我們知道數據是多維的,包括技術維、業務維、管理維、質量維、安全維,針對數據標準的技術維度要求,結合元數據管理自動化構建針對關鍵數據的檢核規則,就能發現數據在技術維度上的不足或問題。

三、企業數據治理執行建議

以上我們從數據生命週期的不同階級講解了開展大數據治理的五個自動化手段,下面我們根據普元多年數據治理項目實施的經驗,給出企業在執行數據治理的一些建議,供大家參考。

企業數據治理的目的是讓數據在業務和技術上保持統一的口徑和準確的含義,能在企業數據架構的規劃下指導信息化的建設,並能在需要的時候對數據進行連接、整合,進而挖掘出數據價值驅動企業運營。

在數據治理執行建議中,我們將數據的生命週期切分成事前、事中和事後三個階段。

圖片描述

在事前階段,要定數據標準,信息系統的數據模型在線上參考標準進行設計,設計好的模型可以直接創建信息系統的數據庫,所有的模型變更調整都在平臺上進行。

模型設計過程中能看到其他系統的數據模型,也能看到其他系統數據標準化的情況。

過程要符合企業系統開發的管理流程,在流程驅動下完成設計和變更工作。

這樣做的好處有以下幾個:

企業元數據在事前的到有效管理和控制。
系統間數據不是割裂的,從數據架構角度看他是一個整體,我在用哪個系統的、那個業務的數據,誰又在用我的數據,一目瞭然,清晰可見。
數據標準(企業信息模型)落地有了載體,有了方法,有了能力支撐,標準執行的程度可查、可控。
全局數據分析有了數據門戶,數據質量在模型層面得到有效提高。

如果企業沒有制定數據標準,這種事前管理思路也是值得嘗試的。

圖片描述

在事後階段,通過檢核的抓手促進企業數據標準落實。

這裏提供兩個抓手

針對生產運行態的元數據進行定期的、自動化抽取,抽取結果和事前設計態元數據進行比對,發現差異,提出整改意見;
根據數據標準規範對關鍵數據進行質量檢核,發現數據問題,提出整改意見。

在事後階段,爲了促進數據質量的持續提升,企業可以引進考覈機制,進而爲數據治理的有效開展提供保障。

關於作者:
王鵬
現任普元大數據產品線數據治理項目實施經理,2009年進入國內數據治理領域,先後主導或參與金融業、運營商、製造業、政府、航空,物流等行業的數據治理解決方案的編寫,以及相關落地項目的實施。

圖片描述

關於EAWorld
微服務,DevOps,元數據,企業架構原創技術分享,EAii(Enterprise Architecture Innovation Institute)企業架構創新研究院旗下官方微信公衆號。
掃描下方二維碼,關注成功後,回覆“普元方法+”,將會獲得熱門課堂免費學習機會!
微信號:EAWorld,長按二維碼關注。

圖片描述

發佈了35 篇原創文章 · 獲贊 15 · 訪問量 3萬+
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章