1.範式說明
1.1 第一範式(1NF)無重複的列
所謂第一範式(1NF)是指數據庫表的每一列都是不可分割的基本數據項,同一列中不能同時有多個值,即實體中的某個屬性不能有多個值或者不能有重複的屬性。如果出現重複的屬性,就可能需要定義一個新的實體,新的實體由重複的屬性構成,新實體與原實體之間爲一對多關係。在第一範式(1NF)中表的每一行只包含一個實例的信息。簡而言之,第一範式就是無重複的列。
在任何一個關係數據庫中,第一範式(1NF)是對關係模式的基本要求,不滿足第一範式(1NF)的數據庫就不是關係數據庫。在當前的任何關係數據庫管理系統(DBMS)中,不可能做出不符合第一範式的數據庫,因爲這些DBMS不允許你把數據庫表的一列再分成二列或多列。因此,你想在現有的DBMS中設計出不符合第一範式的數據庫都是不可能的。
舉例1:
一張學生表Student(stuNo,stuName,age,age,sex)是不符合第一範式的,因爲有重複列age屬性。去除重複列age以後的Student(stuNo,stuName,age,sex)是符合第一範式的。
1.2 第二範式(2NF)屬性完全依賴於主鍵 [ 消除部分子函數依賴 ]
第二範式(2NF)是在第一範式(1NF)的基礎上建立起來的,即滿足第二範式(2NF)必須先滿足第一範式(1NF)。第二範式(2NF)要求數據庫表中的每個實例或行必須可以被唯一地區分。爲實現區分通常需要爲表加上一個列,以存儲各個實例的唯一標識。例如員工信息表中加上了員工編號(emp_id)列,因爲每個員工的員工編號是唯一的,因此每個員工可以被唯一區分。這個唯一屬性列被稱爲主關鍵字或主鍵、主碼。
第二範式(2NF)要求實體的屬性完全依賴於主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那麼這個屬性和主關鍵字的這一部分應該分離出來形成一個新的實體,新實體與原實體之間是一對多的關係。爲實現區分通常需要爲表加上一個列,以存儲各個實例的唯一標識。簡而言之,第二範式就是屬性完全依賴於主鍵。
這裏說的主關鍵字可能不只有一個,有些情況下是存在聯合主鍵的,就是主鍵有多個屬性。
舉例2:
以學生選課爲例,每個學生都可以選課,並且有這一門課程的成績,那麼如果將這些信息都放在一張表StuGrade(stuNo,stuName,age,sex,courseNo,courseName,credit,score)。如果不仔細看,我們會以爲這張表的主鍵是stuNo,但是當我們看到最後一個score屬性以後,在想想如果沒有課程信息,那麼哪裏有學生成績信息呢。所以這張表的主鍵是一個聯合主鍵(stuNo,corseNo),這個聯合屬性能夠唯一確定score屬性。那麼再看其他信息,比如stuName只需要stuNo就能夠唯一確定,courseName只需要courseNo就能夠唯一確定,因此這樣就存在了部分依賴,不符合第二範式。如果要讓學生課程成績信息滿足第二範式,那麼久需要將這張表拆分成多張表,一張學生表Studnet(stuNo,stuName,age,sex),一張課程表Course(courseNo,courseName,credit),還有最後一張學生課程成績表StuGrade(stuNo,courseNo,score)。這樣就符合第二範式了。
1.3 第三範式(3NF)屬性不依賴於其它非主屬性 [ 消除傳遞依賴 ]
滿足第三範式(3NF)必須先滿足第二範式(2NF)。簡而言之,第三範式(3NF)要求一個數據庫表中不包含已在其它表中已包含的非主關鍵字信息。
舉例3:
每一個員工都有一個所屬部門,假如有一個員工信息表Employee(emp_id,emp_name,emp_age,dept_id,dept_name,dept_info)。這張員工信息表的屬性是emp_id,因爲這個屬性能夠唯一確定其他所有屬性,比如知道員工編號emp_id以後,肯定能夠知道員工姓名,所屬部門編號,部門名稱和部門介紹。所以這裏dept_id不是主屬性,而是非主屬性。但是,我們又可以發現dept_name,dept_info這兩個屬性也可以由dept_id這個非主屬性決定,即dept_name依賴dept_id,而dept_id依賴emp_id,這樣就存在了傳遞依賴。而且我們可以看出傳遞依賴的一個明顯缺點就是數據冗餘非常嚴重。
那麼如何解決傳遞依賴問題,其實非常簡單,我們只需要將dept_name,dept_info這連個屬性刪除就可以了,即Employee(emp_id,emp_name,emp_age,dept_id),然後再創建一個部門表Dept(dept_id,dept_name,dept_info)。這樣如果要搜索某一個員工的部門信息dept_info,可以通過數據庫連接來實現,查詢語句如下:
select e.emp_id,e.emp_name,d.dept_name from Employee e,Dept d where e.dept_id=d.dept_id
BC範式
解釋:
- 不能是複合屬性,如果存在,應該拆分爲多個屬性
- 不能是多值屬性,如果存在,應該建立一個實體,而讓此屬性與其存在1對多的關係)
- 不能是重複屬性
解釋:
- 表中必須存在侯選關鍵字,即每一行不同於其他任一行,是惟一區分的
- 任何非關鍵字段不能依賴於侯選關鍵字的一部分
解釋:
- 非關鍵字字段必須直接依賴任一侯選關鍵字
- 非關鍵字段C不能依賴非侯選關鍵字B,因爲樣會形成傳遞依賴:侯選關鍵字A=>B=>C,因爲這時的B往往是外鍵,即其他表的主鍵,也就是說表中不能含有其他表的非主屬性
解釋:
- 與第三範式相比,一個是“任何非關鍵字段不能”,一個是“任何字段不能”,顯然更嚴格了
- 侯選關鍵字或其部分字段不能傳遞依賴其他的侯選關關鍵字
侯選關鍵字:又叫侯選碼,惟一標識一行數據,其真子集不能是侯選關鍵字,一個表可以存在多個侯選關鍵字,如用戶表的username,userid
主關鍵字:又叫主鍵,主碼,被選中的用來區分其它行的侯選關鍵字,一個表只有一個主關鍵字
部分依賴:(A,B)->C,D,如A->C,則C部分依賴A
傳遞依賴:A->B->C,則C傳遞依賴A
注意點:
- 數據庫連接會帶來一部分的性能損失
- 並不是數據庫範式越高越好
- 有時會在數據冗餘與範式之間做出權衡,在實際的數據庫開發過程中,往往會允許一部分的數據冗餘來減少數據庫連接。