數倉3NF模型

3NF的基本解釋
(1)1NF-無重複的列

  數據庫表的每一列都是不可分割的基本數據項,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重複的屬性。

  如果出現重複的屬性,就可能需要定義一個新的實體,新的實體由重複的屬性構成,新實體與原實體之間爲一對多關係。在第一範式(1NF)中表的每一行只包含一個實例的信息。簡而言之,第一範式就是無重複的列。

  說明:在任何一個關係數據庫中,第一範式(1NF)是對關係模式的基本要求,不滿足第一範式(1NF)的數據庫就不是關係數據庫。

(2)2NF-部分依賴

  非主屬性完全依賴於主鍵[消除非主屬性對主碼的部分函數依賴]。

  第二範式(2NF)是在第一範式(1NF)的基礎上建立起來的,即滿足第二範式(2NF)必須先滿足第一範式(1NF)。第二範式(2NF)要求數據庫表中的每個實例或行必須可以被唯一地區分。爲實現區分通常需要爲表加上一個列,以存儲各個實例的唯一標識。例如員工信息表中加上了員工編號(emp_id)列,因爲每個員工的員工編號是唯一的,因此每個員工可以被唯一區分。這個唯一屬性列被稱爲主關鍵字或主鍵、主碼。

  第二範式(2NF)要求實體的屬性完全依賴於主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部分應該分離出來形成一個新的實體,新實體與原實體之間是一對多的關係。爲實現區分通常需要爲表加上一個列,以存儲各個實例的唯一標識。簡而言之,第二範式就是屬性完全依賴於主鍵。

(3)3NF-傳遞依賴

 屬性不依賴於其它非主屬性[消除傳遞依賴]。

  滿足第三範式(3NF)必須先滿足第二範式(2NF)。簡而言之,第三範式(3NF)要求一個數據庫表中不包含已在其它表中已包含的非主關鍵字信息。例如,存在一個部門信息表,其中每個部門有部門編號(dept_id)、部門名稱、部門簡介等信息。那麼在的員工信息表中列出部門編號後就不能再將部門名稱、部門簡介等與部門有關的信息再加入員工信息表中。如果不存在部門信息表,則根據第三範式(3NF)也應該構建它,否則就會有大量的數據冗餘。簡而言之,第三範式就是屬性不依賴於其它非主屬性。

三、實例

  下面以一個學校的學生系統爲例分析說明,這幾個範式的應用。首先第一範式(1NF):數據庫表中的字段都是單一屬性的,不可再分。這個單一屬性由基本類型構成,包括整型、實數、字符型、邏輯型、日期型等。在當前的任何關係數據庫管理系統(DBMS)中,傻瓜也不可能做出不符合第一範式的數據庫,因爲這些DBMS不允許你把數據庫表的一列再分成二列或多列。因此,你想在現有的DBMS中設計出不符合第一範式的數據庫都是不可能的。

  首先我們確定一下要設計的內容包括那些。學號、學生姓名、年齡、性別、課程、課程學分、系別、學科成績,系辦地址、系辦電話等信息。爲了簡單我們暫時只考慮這些字段信息。我們對於這些信息,說關心的問題有如下幾個方面。

  學生有那些基本信息

  學生選了那些課,成績是什麼

  每個課的學分是多少

  學生屬於那個系,系的基本信息是什麼。

  3.1 第二範式(2NF)實例分析

  首先我們考慮,把所有這些信息放到一個表中(學號,學生姓名、年齡、性別、課程、課程學分、系別、學科成績,系辦地址、系辦電話)下面存在如下的依賴關係。

  問題分析

  因此不滿足第二範式的要求,會產生如下問題

  數據冗餘: 同一門課程由n個學生選修,”學分”就重複n-1次;同一個學生選修了m門課程,姓名和年齡就重複了m-1次。

  更新異常:

  1)若調整了某門課程的學分,數據表中所有行的”學分”值都要更新,否則會出現同一門課程學分不同的情況。

  2)假設要開設一門新的課程,暫時還沒有人選修。這樣,由於還沒有”學號”關鍵字,課程名稱和學分也無法記錄入數據庫。

  刪除異常 : 假設一批學生已經完成課程的選修,這些選修記錄就應該從數據庫表中刪除。但是,與此同時,課程名稱和學分信息也被刪除了。很顯然,這也會導致插入異常。

  解決方案

  把選課關係表SelectCourse改爲如下三個表:

  學生:Student(學號,姓名, 年齡,性別,系別,系辦地址、系辦電話);

  課程:Course(課程名稱, 學分);

  選課關係:SelectCourse(學號, 課程名稱, 成績)。

  3.2第三範式(3NF)實例分析

  接着看上面的學生表Student(學號,姓名, 年齡,性別,系別,系辦地址、系辦電話),關鍵字爲單一關鍵字”學號”,因爲存在如下決定關係:

  (學號)→ (姓名, 年齡,性別,系別,系辦地址、系辦電話)

  但是還存在下面的決定關係

  (學號) → (所在學院)→(學院地點, 學院電話)

  即存在非關鍵字段”學院地點”、”學院電話”對關鍵字段”學號”的傳遞函數依賴。

  它也會存在數據冗餘、更新異常、插入異常和刪除異常的情況。 (數據的更新,刪除異常這裏就不分析了,可以參照2.1.1進行分析)

  根據第三範式把學生關係表分爲如下兩個表就可以滿足第三範式了:

  學生:(學號, 姓名, 年齡, 性別,系別);

  系別:(系別, 系辦地址、系辦電話)。 
  

數據倉庫的3NF的特點
數據倉庫之父Immon的方法從全企業的高度設計一個3NF模型,用實體加關係描述的數據模型描述企業業務架構,在範式理論上符合3NF,它與OLTP系統中的3NF的區別,在於數據倉庫中的3NF上站在企業角度面向主題的抽象,而不是針對某個具體業務流程的實體對象關係抽象,它更多的是面向數據的整合和一致性治理,正如Immon所希望達到的:“single version of the truth”。

但是要採用此方法進行構建,也有其挑戰:

需要全面瞭解企業業務和數據
實施週期非常長
對建模人員的能力要求也非常高
————————————————
版權聲明:本文爲CSDN博主「早更人」的原創文章,遵循 CC 4.0 BY-SA 版權協議,轉載請附上原文出處鏈接及本聲明。
原文鏈接:https://blog.csdn.net/fengtaosky/article/details/82625627

發表評論
所有評論
還沒有人評論,想成為第一個評論的人麼? 請在上方評論欄輸入並且點擊發布.
相關文章