數據倉庫學習筆記 --- 緩慢變化維

  • 什麼是緩慢變化維?

    • 在維度建模的數據倉庫中,有一個概念叫做Slowly Changing Dimensions,中文翻譯叫做緩慢變化維,一般縮寫爲SCD;

    • 緩慢變化維的提出是因爲在現實世界中,維度的屬性並不是靜態的,它會隨着時間的流失發生緩慢的變化;

    • 這種隨着時間發生的變化的維度一般稱之爲緩慢變化維,並且把處理維度錶的歷史變化信息的問題處理緩慢維度的問題,有時也稱爲SCD的問題;

  • 緩慢變化的嘗試用的三種類型(後面還有敘述,類型較多,這裏只列出三種)?

    • SCD1 - 類型一、直接覆蓋原值(重新寫入)

      • 這樣處理,最容易也較簡單,無法分析歷史變化信息;

    • SCD2 - 類型二、添加維度行(追加行數據和新增表示列)

      • 這樣處理的方式需要添加代理鍵。實現方式是當有維度屬性發生變化時,生成一條新的維度記錄,主鍵是新的代理鍵,通過自然鍵可以和原維度紀錄保持關聯;

      • 業務鍵:原有的主鍵

      • 代理鍵:新增的字段,比如XXX_ID自增的;

      • 我們還可以增加通過添加列來控制變化的時間範圍,一個起始時間、一個結束時間或者是否有效狀態控制;

    • SCD3 - 類型三、添加屬性列業務鍵是主鍵(新增列,只保留最近兩次做對比)

      • 這種處理的實現方式是對於需要分析歷史信息的屬性添加一列。來記錄該屬性的變化前後的值,而本屬性字段使用類型一來直接覆蓋。這種方式的優點是可以同時分析當前一次變

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章