數據倉庫技術的簡單闡述

數據倉庫技術的簡單闡述
數據倉庫定義:
數據倉庫是在企業管理和就決策中
1.面向主題的
2.集成的
3.與時間相關的
4.不可修改的數據集合

數據倉庫模型三層次
1.概念模型:
概念模型是對真實世界中問題域內的事物的描述
表示概念模型最常用的是:“實體-關係”圖
E-R圖主要是由實體、屬性和關係三個要素構成的。
2.邏輯模型:
邏輯數據模型,反映的是系統分析設計人員對數據存儲的觀點,是對概念數據模型進一步的分解和優化。
數據倉庫的邏輯模型(數據的邏輯結構)包含有:多維模型、關係模型、層次模型等。數據倉庫的邏輯模型描述數據倉庫的主要的邏輯實現,每個主題對應的模式定義。
3.物理模型
邏輯模型的具體體現,如物理存取方式、數據存儲結構、數據存放位置以及存儲分配等。在設計數據倉庫的物理模型,需要考慮一些提高性能的技術,如表分區,建立索引等。(數據在數據庫中的存取方式)

數據倉庫邏輯模型-多維模型
對數據倉庫邏輯模型的討論大多集中在邏輯模型,其中最常用的是多維模型。
維:關注數據的特定角度(例如企業關注不同銷售數據隨時間的變化情況,時間就是一個維)
維的層次:人們觀察數據的某個特定角度還可以存在細節程度不同的多個描述,這就是維的層次。(如:時間維:年份、季度、月份、周、天)
維成員:維的一個取值成爲該維的一個成員。如果一個維是多層次的,那麼該維的成員就是在不同層次取值的組合。(例:某年某月某日)
度量:描述要分析的數值。(例:用電量、話費、用戶數量)
粒度:粒度是數據倉庫的數據單位中保存的數據的細化或綜合程度的級別。粒度大小影響數據量的大小,同時影響數據 倉庫所能回答的查詢類型。粒度越小,數據量越大,同時數據所能回答查詢的能力會隨之提高。

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章