數倉基本概念

原文鏈接:https://help.aliyun.com/document_detail/114631.html?spm=a2c4g.11186623.6.596.a9832221X9qCnB

 

  • 業務板塊:比數據域更高維度的業務劃分方法,適用於特別龐大的業務系統。
  • 維度:維度建模由Ralph Kimball提出。維度模型主張從分析決策的需求出發構建模型,爲分析需求服務。維度是度量的環境,是我們觀察業務的角度,用來反映業務的一類屬性 。屬性的集合構成維度 ,也可以稱爲實體對象。例如, 在分析交易過程時,可以通過買家、賣家、商品和時間等維度描述交易發生的環境。
  • 屬性(維度屬性):維度所包含的表示維度的列稱爲維度屬性。維度屬性是查詢約束條件、分組和報表標籤生成的基本來源,是數據易用性的關鍵。
  • 度量:在維度建模中,將度量稱爲事實 , 將環境描述爲維度,維度是用於分析事實所需要的多樣環境。度量通常爲數值型數據,作爲事實邏輯表的事實。
  • 指標:指標分爲原子指標和派生指標。原子指標是基於某一業務事件行爲下的度量,是業務定義中不可再拆分的指標,是具有明確業務含義的名詞 ,體現明確的業務統計口徑和計算邏輯,例如如支付金額。
    • 原子指標=業務過程+度量
    • 派生指標=時間週期+修飾詞+原子指標,派生指標可以理解爲對原子指標業務統計範圍的圈定。
  • 業務限定:統計的業務範圍,篩選出符合業務規則的記錄(類似於SQL中where後的條件,不包括時間區間)。
  • 統計週期:統計的時間範圍,例如最近一天,最近30天等(類似於SQL中where後的時間條件)。
  • 統計粒度:統計分析的對象或視角,定義數據需要彙總的程度,可理解爲聚合運算時的分組條件(類似於SQL中的group by的對象)。粒度是維度的一個組合,指明您的統計範圍。例如某個指標是某個賣家在某個省份的成交額,則粒度就是賣家、地區這兩個維度的組合。如果您需要統計全表的數據,則粒度爲全表。在指定粒度時,您需要充分考慮到業務和維度的關係。統計粒度常用語作爲派生指標的修飾詞而存在。
發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章