数据仓库学习笔记 --- 缓慢变化维

  • 什么是缓慢变化维?

    • 在维度建模的数据仓库中,有一个概念叫做Slowly Changing Dimensions,中文翻译叫做缓慢变化维,一般缩写为SCD;

    • 缓慢变化维的提出是因为在现实世界中,维度的属性并不是静态的,它会随着时间的流失发生缓慢的变化;

    • 这种随着时间发生的变化的维度一般称之为缓慢变化维,并且把处理维度表的历史变化信息的问题处理缓慢维度的问题,有时也称为SCD的问题;

  • 缓慢变化的尝试用的三种类型(后面还有叙述,类型较多,这里只列出三种)?

    • SCD1 - 类型一、直接覆盖原值(重新写入)

      • 这样处理,最容易也较简单,无法分析历史变化信息;

    • SCD2 - 类型二、添加维度行(追加行数据和新增表示列)

      • 这样处理的方式需要添加代理键。实现方式是当有维度属性发生变化时,生成一条新的维度记录,主键是新的代理键,通过自然键可以和原维度纪录保持关联;

      • 业务键:原有的主键

      • 代理键:新增的字段,比如XXX_ID自增的;

      • 我们还可以增加通过添加列来控制变化的时间范围,一个起始时间、一个结束时间或者是否有效状态控制;

    • SCD3 - 类型三、添加属性列业务键是主键(新增列,只保留最近两次做对比)

      • 这种处理的实现方式是对于需要分析历史信息的属性添加一列。来记录该属性的变化前后的值,而本属性字段使用类型一来直接覆盖。这种方式的优点是可以同时分析当前一次变

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章