10. 在企業經濟學/企業管理學中的應用
- 提供信息
- 數據與信息作爲決策的基礎(比如:Kennzahlen 可作參數,特性數值,代碼);
- 對未來的經營業績以及業務流程的影響;
- 使用者:經理,部門領導,專業人員;
- 提供信息的形式:
- )查詢方法 - 自定義查詢以及報告(獨立的解決策略);
- )報告:預定義報告的訪問(固定的解決方案);
- )編輯整理個性化信息;
- )特定域的數據視圖;
- )預計算參數/特徵值(比如,通過數據挖掘算法)。
- 分析
- 對數據進行詳細(細節)分析以用於對偏差或者異常的研究(/審查)
- 場景技術(What-If-分析)
- 使用者:專家(比如:審計方面的,銷售方面的)
- 計劃
- 通過探索性,發掘性的數據分析來支持計劃;
- 單個計劃的聚合;
- 預測方法(比如:季節性統計模型);
- 市場活動管理
- 支持策略性市場活動;
- 客戶分析,投資和風險分析;
11. 在科學和技術中的應用
- 科學應用
- 科學統計數據庫 → 數據倉庫的技術根源;
- 比如:地球觀測系統項目(氣候和環境研究)
- 每天差不多1.9TB的氣候學數據;
- 調整準備與分析(統計,數據挖掘);
- 技術應用
- 開放領域:帶環境或者地理數據的數據倉庫(比如:水分析);
12. 使用示例
- 沃爾瑪(www.wal-mart.com)
- 美國零售商的市場領導者
- 企業級數據倉庫:
- 大小:大概300 TB(2003),480 TB(2004),如今:估計12 PB;
- 每日差不多25.000 數據倉庫查詢(DW - Anfragen);
- 較高細化度(商品銷售額,庫存,用戶行爲的日常評定);
- 購物籃分析,客戶分類...的基礎;
13. 提出的問題和任務(示例)
- 審查商品種類用於識別滯銷品或者暢銷品;
- 位置分析用以評估分店盈利;
- 研究和預測市場行爲;
- 對用戶調查,某些產品的退貨...等的評定;
- 庫存分析;
- 藉助收款臺對購物籃分析(經濟金融交易);
14. 查詢示例
A州和B州 的 啤酒與紅酒 的產品在 2009和2010年 的 銷售額 是多少?
15. 結果(立方體)
16. 結果(二維立方體表達)
銷售額 | 啤酒 | 紅酒 | 總和 | |
---|---|---|---|---|
2009 | A | 45 | 32 | 77 |
B | 52 | 21 | 73 | |
總和 | 97 | 53 | 150 | |
2010 | A | 60 | 37 | 97 |
B | 58 | 20 | 78 | |
總和 | 118 | 57 | 17 |
17. 數據倉庫方面
- 集成
- 統一來自不同,且大部分異構的來源的數據;
- 克服不同層次的異構性(系統,模式,數據);
- 分析
- 以一個用戶希望的格式提供數據(參照決策領域);
- 要求預選,時間相關,聚合;
18. 短事務(OLTP)
Kunde(客戶) | |||||
ID | Name | Firstname | PLZ | Ort | Straße |
4711 | Saake | Gunter | 01234 | Anywhere | Am Berg 3 |
42 | Sattler | K. | 12234 | Here | Zufahrt 18 |
0800 | Köppen | Veit | 60701 | Dort | Weg 9A |
SELECT Firstname, name
FROM Kunde
WHERE id = 0800
結果:
Veit Köppen
19. 長事務(OLAP)
SELECT DISTINCT ROW Zeit.Dimension AS Jahr,
Produkt.Dimension AS Artikel,
AVG(Fact.Umsatz) AS Umsatzdurchschnitt,
Ort.Dimension AS Verkaufsgebiet
FROM (Produktgruppe INNER JOIN Produkt ON Produktgruppe.
[Gruppen-Nr] = Produkt.[Gruppen-ID]) INNER JOIN
((((Produkt INNER JOIN [Fact.Umsatz] ON Produkt.[Artikel-Nr]
= [Fact.Umsatz].[Artikel-Nr]) INNER JOIN Order ON
[Fact.Umsatz].[Bestell-Nr]= Order.[Order-ID]) INNER JOIN
Zeit.Dimension ON Orders.[Order-ID] =
Zeit.Dimension.[Order-ID]) INNER JOIN Ort.Dimension ON
Order.[Order-ID] = Ort.Dimension.[Order-ID]) ON
Produktgruppe.[Gruppen-Nr] = Produkt.[Gruppen-ID]
GROUP BY Produkt.Dimension.Gruppenname, Ort.Dimension.Bundesland,
Zeit.Dimension.Jahr;
20. 與OLTP的區別
- 傳統的操作型信息系統 → 在線事務處理(OLTP)
- 蒐集和管理數據;
- 每個部門負責自己相關的處理部分;
- 事務處理:對少量數據記錄的讀、寫訪問;
- 數據倉庫 → 在線分析處理(OLAP)
- 重點在於分析;
- 對大量數據記錄的長時間讀事務;
- 集成,合併和聚合數據。