SAP BI 基本概念


SAP BI基本概念

SAP BI基本概念

基本概念

數據倉庫基本理論

數據倉庫是體系結構化環境的核心,是決策支持系統(DSS)處理的基礎;它的概念提出者、美國著名信息工程專家 William Inmon 博士在90年代初提出了數據倉庫的一個表述。他認爲:“一個數據倉庫通常是一個面向主題的、集成的、隨時間變化的、但信息本身相對穩定的用來支持管理人員決策的數據集合。”

主題,是指用戶使用數據倉庫進行決策時所關心的重點方面,如:收入、客戶、銷售渠道等;面向主題,是指數據倉庫內的信息是按主題進行組織的,而不是像業務支撐系統那樣是按照業務功能進行組織的。

集成,是指數據倉庫中的信息不是從各個業務系統中簡單抽取出來的,而是經過一系列加工、整理和彙總的過程,因此數據倉庫中的信息是關於整個企業的一致的全局信息。

隨時間變化,是指數據倉庫內的信息並不只是反映企業當前的狀態,而是記錄了從過去某一時點到當前各個階段的信息。通過這些信息,可以對企業的發展歷程和未來趨勢做出定量分析和預測。

本身相對穩定,是指一旦某個數據進入數據倉庫以後,一般很少進行修改,更多的是對信息進行查詢操作。

依據上面的定義,有人可能會把數據倉庫簡單地理解爲僅僅是一個大型的數據存儲機制,是一個靜態的概念。實際上,數據倉庫更像一個過程,這個過程涉及數據的收集、整理和加工,生成決策所需要的信息,並且最終把這些信息提供給需要這些信息的使用者,供他們做出改善業務經營的正確決策。

數據倉庫的重點與要求就是能夠準確、安全、可靠地從業務系統中取出數據,經過加工轉換成有規律信息之後,供管理人員進行分析使用。因此數據倉庫是一個動態的概念,應該稱爲數據倉庫工程(Data Warehousing)。

SAP BI7.0介紹

SAP BI(Business Intelligence)商務智能,是SAP公司的數據倉庫解決方案,BI7.0以前的版本稱爲BW(Business Information Warehouse)業務信息倉庫,它將來自源系統的數據(可以是SAP R3,也可以是其它事務處理系統、文本文件、數據庫、或其它BW/BI系統),經過抽取、轉換、上載至BI數據倉庫,以EXCEL、WEB等形式的報表展示給用戶。

SAP BI7.0體系架構

clip_image001

圖 1.1

如圖1.1展示了SAP BI平臺的體系架構,它包括了以下幾個部分:

1. 數據抽取、傳輸、上載工具(ETL)

從來自不同的數據源系統自動上載、整理、整合數據;

2. 數據存取工具

數據倉庫可以保證存儲有足夠量的數據來滿足客戶的業務分析和信息決策的需求;

3. 強大的前段分析工具

通過報表設計器客製化報表,使客戶可以利用上載過來的數據進行分析和決策,並提供兩種不同的查詢和分析風格:WEB格式和EXCEL(Analyzer)格式;

4. 監測系統運行效率的工具

管理平臺提供數據ETL等執行過程的作業安排、監控和有效的管理,並能制定滿足要求的數據處理邏輯。

BI系統同ERP系統的關係

ERP系統是典型的OLTP(聯機在線處理)系統,BI系統是OLAP(聯機在線分析)系統,他們的側重點不同,有不同的功能和任務。

ERP系統用於日常快速有效的處理業務流程,包含了最原始、最明細的單據。

BI系統做海量業務數據的在線分析,用於產生決策信息和知識,它不僅可以包含明細單據,最重要的是對單據根據決策需求進行彙總分析。

image

SAP BI7.0中基本術語介紹

信息對象(InfoObject

信息對象 業務評估對象和表字段在BI中被稱爲信息對象,它是BI中最小的單元,通過它將信息部署爲各種結構,信息對象分爲特性和關鍵值兩部分:

1. 特性Characteristics

在主數據表中的信息對象,例如客戶、供應商、加油站、銷售小組等。

系統必備的特殊類型的特性有以下三個:

時間特性與時間相關的特性“Fiscal period”, “Calendar year”, ...

單位特性國際通用的單位 “Local currency” or “0Unit

技術特性例如請求號等

2. 關鍵值Key figures

關鍵值在報表中提供數值,例如銷售數量、金額等。

數據存儲對象(DSO

DSO(DataStore Objects ) 數據存儲對象 是單據級的業務數據或主數據在BI中的存儲點,DSO中的數據也可以用於報表的使用分析,它有三種類型:標準DSO、寫入優化DSO和直接更新DSO。

標準DSO它的結構包括待激活數據隊列、激活後的數據、更改日誌, 用於BI系統中抽取和加載數據過程中的數據存儲。

寫入優化DSO它的結構只包含激活後的數據,特點是加載到其中的數據無需手工激活,可以迅速進行下一步處理。

直接更新DSO該類型的DSO數據可來自報表、信息集,不能使用一般數據源提供數據,它的結構中只包含一種形式的數據,因此數據與它的數據提供者中保持一致。

信息立方體(InfoCube

INFOCUBE 信息立方體 是多維信息提供者的一個類型,從報表角度看,一個INFOCUBE描述了一個完備的面向業務的數據集,同樣這個數據集可以用於報表分析。

clip_image003

圖 1.2

信息立方體的信息存儲是一個星型的模型結構,上圖所示是一個簡易的星型模型,中央的關鍵指標和周圍的特性共同組成了一個多維分析模型;存儲關鍵指標的表我們稱作事實表(Fact Table),周圍特性的編號存放於維度表(Dimension Table)中,而特性的描述、層次等信息通過編號來與後臺的SID表關聯得到,詳細結構見下圖:

clip_image005

圖 1.3

模型由中間的事實表(Fact Table)和周圍的維度表(Dimension Table)組成,通過外鍵將事實表和維度表連接在一起,在SAP BI中維度表由業務分析對象組成例如客戶、銷售辦公室、時間等,事實表由維表ID和關鍵值例如銷量、金額等。

複合立方體(MultiCube

Multi-CUBE 複合立方體 是一種方便出具跨模塊報表的,集合了多個信息提供器(CUBE,DSO等)的信息提供者;它本身不包含任何數據,它的數據全部來源於它的下掛信息提供器。

數據源和信息源

數據源(DataSource) 提供BI數據的來源,一般是在源系統中由一些有邏輯關係的字段組成的結構,BI系統通過ETL機制從中獲得數據。

信息源(InfoSource) BI中由信息對象組成的,可對應多個數據源和信息提供者的數據傳輸結構,數據的傳輸路徑是:源系統數據源->信息源->信息提供者。

傳輸規則、更新規則、轉換

傳輸規則(transfer rules)提供給數據源和信息源之間的邏輯鏈接, 允許數據字段到信息對象的映射、常量或者ABAP例程控制, 可以在傳輸交易數據、屬性、文本或層次中使用

更新規則(update rules) 提供給信息源和數據目標之間的邏輯鏈接, 允許信息對象到信息對象的映射、或者ABAP例程控制, 只能在數據目標的特性或者關鍵指標中使用

轉換(transformations) 在BI7.0中用於提供數據源與數據目標或者數據提供者與數據目標之間的邏輯鏈接,可以在信息對象的映射中建立常量或ABAP例程的控制。

數據流

clip_image007

圖 1.4

SAP BI7.0中的數據流如上圖所示,通過SAP BI的數據抽取機制將源系統數據源中的數據按定製的計劃進行分段上載,通過傳輸結構先上載到PSA(Persistent Staging Area ,持續分段傳輸區域)再通過信息源的對照與更新規則的清洗轉換上載到信息提供者DSO,最終通過轉換進入信息立方體提供報表查詢分析。

數據傳輸進程

數據傳輸進程(Data Transfer Process)是決定數據如何在兩個數據存儲對象間傳輸的對象,它用於在BI中依照確定的轉換和過濾器在兩個數據存儲對象間傳輸數據。

數據處理鏈

數據處理鏈(Process Chain )是BI7.0中後臺定製的爲特定事件安排的一個處理隊列,它的優點是可以自動的、形象化的、可完全監控的處理一系列事件

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章