spark-15.sparkSQL_6_數據倉庫

數據倉庫,英文名稱爲Data Warehouse,可簡寫爲DW或DWH。數據倉庫,是爲企業所有級別的決策制定過程,提供所有類型數據支持的戰略集合。它出於分析性報告和決策支持目的而創建。 爲需要業務智能的企業,提供指導業務流程改進、監視時間、成本、質量以及控制。

特點:

數據倉庫的數據是面向主題的;
數據倉庫的數據是集成的;
數據倉庫的數據是不可更新的,能追加但不能更改;
數據倉庫的數據是隨時間不斷變化的;

發展階段:

  • 簡單報表階段:
    解決一些日常的工作中業務人員需要的報表,以及生成一些簡單的能夠幫助領導進行決策所需的彙總數據。這個階段的大部分表現形式爲數據庫和前端報表工具。
  • 數據集市階段:
    這個階段主要根據業務部門的需要,進行一定的數據採集,整理,按照業務人員的需要,進行多維報表的展現,能夠提供對特定業務指導的數據,並且能夠提供特定的領導決策數據。
  • 數據倉庫階段:
    這個階段主要按照一定的數據模型,對整個企業的數據進行採集,整理,並且能夠按照各個業務部門的需要,提供跨部門的,完全一致的業務報表數據,能夠通過數據倉庫生成對業務具有指導性的數據,同時爲領導決策提供全面的數據支持。

數據倉庫的分層:

ODS(臨時存儲層)
PDW(數據倉庫層)
DM(數據集市層)
APP(應用層)

數據倉庫的建模:

1.業務模型,主要解決業務層面的分解和程序化。
2.領域模型,對業務模型進行抽象處理,生成領域概念模型。
3.邏輯模型,主要將領域模型的概念實體以及實體之間的關係進行數據庫層次的邏輯化。
4.物理模型,主要解決邏輯模針對不同關係型數據庫的物理化以及性能等一些具體的技術問題。

建模方法:

  • 範式建模法
  • 實體建模法
  • 維度建模法
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章