企業數據治理的重點和難點

                                                                                          來源:中翰軟件轉發

大數據是信息經濟時代的必然產物,無論新聞電視還是網絡媒體,每天都會有大數據成果的相關報道。作爲普通消費者,深切體會大數據無所不在的魅力,當你打開淘寶或京東,你就會發現一堆瀏覽過的商品推薦給了你,這是利用消費者心理學、消費者行爲學構建的數據模型在起作用,那麼企業B2B業務是否也可以這麼做呢?企業期望利用大數據提升市場洞察、挖掘內部潛力、提高銷售收入,顯然建模難度要大的多。本文先不談建模的方法和工具,我們要談的是大數據基礎的基礎:數據治理

 數據治理

 主數據,也稱基礎數據,是可以被重複使用到業務單據中的數據,如客戶、供應商、產品、物資、員工等。數據治理就是將不規範的數據進行規範,不完善的數據進行完善,刪除重複的數據,保證一物一碼,說起來簡單,實際做起來並不輕鬆,按照中翰軟件在行業內的經驗,我們總結了重點和難點,供大家學習和交流。

 第一步:確定主數據對象範圍

 在茫茫數據大海中,首先要識別主數據和業務數據,通常意義上講,數據分爲基礎數據、主數據、條件數據、事務型數據、結果型數據和報表數據,識別主數據的標準爲是否最終用戶使用、數據的穩定性、數據被重複使用或參考的頻率等。

明確了主數據對象,以及其應用的業務範圍和系統範圍後,主數據對象範圍基本確定。

第二步:修訂數據標準規範

 很多企業在確定要建設主數據管理平臺時,在企業內部的主數據管理領域是一窮二白,都是期望拿到同行業企業的資料做參考後形成企業的標準規範。這種做法肯定是一條捷徑,但需要吃透後再搬就會更加合理,否則容易造成表面上很光鮮,實際應用後可能水土不服。

在該階段,最大的捷徑是在企業內部明確各個主數據對象的專家,由專家牽頭,相關部門配合來梳理數據標準和制定主數據標準規範。主數據的標註規範一般包括主數據對象的數據字典、數據分類、數據編碼規則、數據描述規則,確定主數據對象的完整性規則(必輸、可選、隱藏、顯示)、主數據對象的唯一性規則(確保一物一碼)、主數據對象的規範性規則(確定每一個輸入框的值符合標準規範)。

物資主數據是非常特殊的一類,一般情況下物資需要分大類、中類、小類和品名,不同的類別、代表物資固有屬性的字段也不相同,所以需要在明確分類的同時,也需要明確每一類物資下應有的屬性描述和屬性值範圍,這是主數據標準規範制定中最大的難點。

 第三步:確定主數據維護流程

 主數據維護流程一般定義爲主數據新建流程、主數據修改流程、主數據凍結/解凍流程、主數據歸檔流程。爲何要使用流程呢?因爲不論是否搭建主數據管理系統(MDM系統),主數據都是由使用者提需求,相關部門做審覈控制後編碼。

只要是系統能夠控制的,就不應該由人來做控制,所以在主數據流程討論以及編制的流程文檔中,需要把每一個流程中系統的控制點、默認值設定、推導值設定、唯一性校驗等都需要體現出來。

 第四步:歷史主數據清洗

 一般企業都是在實施完ERP、MES等經營、生產相關的系統之後,纔開始想到要做主數據統一管理平臺,因爲各個系統之間的數據都是各自爲戰,即使在設計時是統一的,但使用一段時間之後必然成爲數據孤島。

數據清理的最大難點是人的問題,需要抽調大量的人力將不符合規範要求的數據洗白,從而符合主數據管理標準規範的要求。那麼,是否一定要這麼做呢?答案是肯定的,唯一可以減少工作量的技巧就是對幾年之內沒有發生過業務的主數據不清理,這些主數據在經營或生產系統中不允許做業務,如果將來該主數據要發生,那麼需要先修改成符合標準規範的數據後,再允許做業務。

 第五步:主數據應用跟蹤和分析

 在企業經營管理上,沒有管理者會去關心主數據應用的怎麼樣,他們主要關心的是銷售額是否可以提升、新市場開拓的如何、成本控制的結果怎麼樣等分析數據。但在主數據管理部門,他們更關心的是主數據質量,包括採標率、活躍度、申請質量、應用質量、編碼效率等,這是確保主數據高質量運行的有效抓手,構成了主數據申請、主數據監控和主數據清洗的全生命週期閉環。

 對主數據採標率的分析,可以逐步清理乾淨非採標數據;對活躍度的分析,可以定期清理非動態的主數據;對數據編碼進度的監控,可以提高編碼效率;對數據應用質量的監控,可以確保在主數據標準規範調整後(唯一性、完整性和規範性)的數據清洗。

 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章