數據倉庫技術(Data Warehouse Technologien) 第一章節 總覽(2)

10. 在企業經濟學/企業管理學中的應用

  • 提供信息
  1. 數據與信息作爲決策的基礎(比如:Kennzahlen 可作參數,特性數值,代碼);
  2. 對未來的經營業績以及業務流程的影響;
  3. 使用者:經理,部門領導,專業人員;
  4. 提供信息的形式:
    1. )查詢方法 - 自定義查詢以及報告(獨立的解決策略);
    2. )報告:預定義報告的訪問(固定的解決方案);
    3. )編輯整理個性化信息;
    4. )特定域的數據視圖;
    5. )預計算參數/特徵值(比如,通過數據挖掘算法)。
  • 分析
  1. 對數據進行詳細(細節)分析以用於對偏差或者異常的研究(/審查)
  2. 場景技術(What-If-分析)
  3. 使用者:專家(比如:審計方面的,銷售方面的)
  • 計劃
  1. 通過探索性,發掘性的數據分析來支持計劃;
  2. 單個計劃的聚合;
  3. 預測方法(比如:季節性統計模型);
  • 市場活動管理
  1. 支持策略性市場活動;
  2. 客戶分析,投資和風險分析;

11. 在科學和技術中的應用

  • 科學應用
  1. 科學統計數據庫 → 數據倉庫的技術根源;
  2. 比如:地球觀測系統項目(氣候和環境研究)
    1. 每天差不多1.9TB的氣候學數據;
    2. 調整準備與分析(統計,數據挖掘);
  • 技術應用
  1. 開放領域:帶環境或者地理數據的數據倉庫(比如:水分析);

12. 使用示例

  • 沃爾瑪(www.wal-mart.com)
  • 美國零售商的市場領導者
  • 企業級數據倉庫:
  1. 大小:大概300 TB(2003),480 TB(2004),如今:估計12 PB;
  2. 每日差不多25.000 數據倉庫查詢(DW - Anfragen);
  3. 較高細化度(商品銷售額,庫存,用戶行爲的日常評定);
  4. 購物籃分析,客戶分類...的基礎;

13. 提出的問題和任務(示例)

  • 審查商品種類用於識別滯銷品或者暢銷品;
  • 位置分析用以評估分店盈利;
  • 研究和預測市場行爲;
  • 對用戶調查,某些產品的退貨...等的評定;
  • 庫存分析;
  • 藉助收款臺對購物籃分析(經濟金融交易);

14. 查詢示例

A州和B州 的 啤酒與紅酒 的產品在 2009和2010年 的 銷售額 是多少?

15. 結果(立方體)

數據倉庫立方體(特徵值含義:2009年在A州啤酒的銷售額)

16. 結果(二維立方體表達)

銷售額 啤酒 紅酒 總和
2009 A 45 32 77
B 52 21 73
總和 97 53 150
2010 A 60 37 97
B 58 20 78
總和 118 57 17

17. 數據倉庫方面

  • 集成
  1. 統一來自不同,且大部分異構的來源的數據;
  2. 克服不同層次的異構性(系統,模式,數據);
  • 分析
  1. 以一個用戶希望的格式提供數據(參照決策領域);
  2. 要求預選,時間相關,聚合;

18. 短事務(OLTP)

Kunde(客戶)
ID Name Firstname PLZ Ort Straße
4711 Saake Gunter 01234 Anywhere Am Berg 3
42 Sattler K. 12234 Here Zufahrt 18
0800 Köppen Veit 60701 Dort Weg 9A
SELECT Firstname, name
FROM Kunde
WHERE id = 0800

 結果:

Veit Köppen

 

19. 長事務(OLAP)

SELECT DISTINCT ROW Zeit.Dimension AS Jahr,
                    Produkt.Dimension AS Artikel,
                    AVG(Fact.Umsatz) AS Umsatzdurchschnitt,
                    Ort.Dimension AS Verkaufsgebiet

FROM (Produktgruppe INNER JOIN Produkt ON Produktgruppe.
      [Gruppen-Nr] = Produkt.[Gruppen-ID]) INNER JOIN
      ((((Produkt INNER JOIN [Fact.Umsatz] ON Produkt.[Artikel-Nr]
      = [Fact.Umsatz].[Artikel-Nr]) INNER JOIN Order ON
      [Fact.Umsatz].[Bestell-Nr]= Order.[Order-ID]) INNER JOIN
      Zeit.Dimension ON Orders.[Order-ID] =
      Zeit.Dimension.[Order-ID]) INNER JOIN Ort.Dimension ON
      Order.[Order-ID] = Ort.Dimension.[Order-ID]) ON
      Produktgruppe.[Gruppen-Nr] = Produkt.[Gruppen-ID]

GROUP BY Produkt.Dimension.Gruppenname, Ort.Dimension.Bundesland,
      Zeit.Dimension.Jahr;

20. 與OLTP的區別

  • 傳統的操作型信息系統 → 在線事務處理(OLTP)
  1. 蒐集和管理數據;
  2. 每個部門負責自己相關的處理部分;
  3. 事務處理:對少量數據記錄的讀、寫訪問;
  • 數據倉庫 → 在線分析處理(OLAP)
  1. 重點在於分析;
  2. 對大量數據記錄的長時間讀事務;
  3. 集成,合併和聚合數據。
發佈了35 篇原創文章 · 獲贊 10 · 訪問量 6883
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章