ERP數據分析

存在於ERP裏的數據不能直接進行分析處理。因爲ERP的運行方法是聯機事務處理OLTP(後有介紹),是基於傳統的數據庫技術、由事件驅動、面向應用功能和性能的操作型處理。對OLTP的要求是有明確的處理模型或公式、快速響應、安全和完整地將當前事務所產生的記錄保存下來,方便地對保存的數據進行必要的維護等。爲保證ERP的這些性能,它的數據庫是按過程組織的,在一個結構中可能既包括了處理之前的原始數據又有處理之後的結果數據,還有數據的狀態說明和其它的輔助性、過渡性的數據,它們交織在一起。結果ERP數據庫中的數據可以說是事無鉅細的混和體。在OLTP中爲了業務過程的處理的方便和效率這作法是必要的。但是這種數據結構對於綜合性的分析,就太多、太繁瑣和沒有必要。分析處理只須要所關注對象的核心數據。爲提高分析的效率,將這部分數據從原始數據庫中抽取出來,構成面向針對性主題的、精簡的新的數據組織方式,再進行分析。

另外,ERP數據庫缺少對歷史數據的有效組織:ERP的數據主要是實時的,缺少對歷史數據的積累和便於分析訪問的有效結構。從分析處理過程來看,分析一般需要多表操作、較長的運行時間,若直接利用ERP業務系統的數據庫中現有的數據進行決策的分析和推理、將影響ERP系統OLTP的效率,並造成繁忙的網絡數據傳輸。在需要直接訪問歷史數據時更是困難。因此分析數據不能直接與OLTP的數據庫相連,必須建立獨立的數據存儲空間和結構。所以分析處理需要新的數據組織方式——數據倉庫。

 

數據倉庫技術

1991
年,數據倉庫概念的創始人W.H.Inmon做出定義:數據倉庫Data Warehouse是面向主題的、集成的、穩定的、不同時間的數據集合,用以支持數據分析和管理決策過程。在這個定義中,主題是數據歸類的標準,每個主題對應一個客觀分析領域,它可以爲輔助決策集成多個部門不同系統的大量數據。通俗來說,數據倉庫是按照我們分析的對象組織的。數據倉庫包含了大量的歷史數據,經集成後進入數據倉庫的數據是極少更新的。數據倉庫內的數據時限爲5年至10,主要用於進行時間趨勢分析。數據倉庫的數據量很大,一般爲10GB以上,大型數據倉庫達到TB級。

 

 

聯機分析處理OLAP

OLAP(
聯機分析處理:On-line Analytical Processing)是對數據倉庫的信息分析處理過程,是數據倉庫與用戶接口部分。OLAP的目標是滿足決策支持或多維環境特定的查詢和報表需求,它的技術核心是”——或視角這個概念。因此OLAP也可以說是多維數據分析工具的集合。OLAP系統是跨部門、面向主題的。其基本特點是:基礎數據來源於生產系統中的操作數據(Operational Data);響應時間合理;用戶數量相對較小,其用戶主要是業務決策與管理人員。OLAP的結果主要採用圖形、表格等可視化方式表達和輸出,方便於決策應用。

                                         何銳 

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章