一、資料庫基本概念 1、關係資料庫規範化理論 為使資料庫設計的合理可靠、簡單實用,長期以來,形成了關係資料庫設計理論,即規範化理論。 (1)函數依賴 定義:在表1.1中,描述學生信息時,包括學生的學號、姓名、性別、專業、總學分和備註屬性,由於一個學號對應一名學生,確定了學生學號,一名學生的姓名、性別 ...
一、資料庫基本概念
1、關係資料庫規範化理論
為使資料庫設計的合理可靠、簡單實用,長期以來,形成了關係資料庫設計理論,即規範化理論。
(1)函數依賴
- 定義:在表1.1中,描述學生信息時,包括學生的學號、姓名、性別、專業、總學分和備註屬性,由於一個學號對應一名學生,確定了學生學號,一名學生的姓名、性別、專業等屬性也就確定下來,這說明學生姓名、性別、專業、總學分和備註對學生的學號有依賴性,在關係資料庫中稱為函數依賴。即:所謂函數依賴是指關係中一個或一組屬性的值可以決定其它屬性的值。函數依賴正象一個函數 y = f(x) 一樣,x的值給定後,y的值也就唯一地確定了。
- 函數依賴的種類:
1)完全函數依賴和部分函數依賴:
完全函數依賴:在一個關係中,若某個非主屬性數據項依賴於全部關鍵字稱之為完全函數依賴。
比如:有一個表,有如下屬性:學生ID,學生姓名,所修課程ID,課程名稱,成績
完全依賴:(學生ID,所修課程ID)→成績
成績既不能單獨依賴於學生ID,也不能單獨依賴於所修課程ID,因此成績完全函數依賴於關鍵字。
(學生ID,所修課程ID)→學生姓名
部分依賴:學生ID→學生姓名
學生姓名可以依賴於關鍵字的一個主屬性——學生ID,因此學生姓名部分函數依賴於(學生ID,所修課程ID)。
2)平凡函數依賴和非平凡函數依賴
平凡函數依賴:當關係中屬性集合Y是屬性集合X的子集時,存在函數依賴X→Y,即一組屬性函數決定它的所有子集,這種函數依賴稱為平凡函數依賴。
例如:在在關係學生課程表SC(學生號Sno,課程號 Cno,成績 Grade)中,
(Sno, Cno) → Sno ,(Sno, Cno) → Cno
非平凡函數依賴:當關係中屬性集合Y不是屬性集合X的子集時,存在函數依賴X→Y,則稱這種函數依賴為非平凡函數依賴。
例如:(Sno, Cno) → Grade
3)傳遞函數依賴
傳遞函數依賴:設X,Y,Z是關係R中互不相同的屬性集合,存在X→Y(Y !→X),Y→Z,則稱Z傳遞函數依賴於X。
例:關係S1(學號,系名,系主任)
學號 → 系名,系名 → 系主任,並且 系名 -\→ 學號,所以 學號 → 系主任 為傳遞函數依賴
(2)範式理論
範式是資料庫設計中一個重要的過程,通過它可以優化資料庫設計,避免一些問題,可以減少數據冗餘,可以改進資料庫整體組織,可以增強數據的一致性,可以增加資料庫設計的靈活性。因此,在確定設計資料庫之前,還需對資料庫中的表進行範式處理,以確保資料庫遵從適當的範式,從而使設計的資料庫更加規範。
目前關係資料庫有6種範式:第一範式(1NF)、第二範式(2NF)、第三範式(3NF)、第四範式(4NF)、第五範式(5NF)和第六範式(6NF)。滿足最低要求的是第一範式(1NF)。在第一範式的基礎上滿足更多要求的範式稱為第二範式(2NF),其餘的範式以此類推。一般來說,資料庫只需要滿足第三範式(3NF)即可。
- 第一範式
如果關係模式R的每個關係r的屬性都是不可分的數據項,那麼就稱R是第一範式的模式。第一範式是設計資料庫表的最低要求,其最主要的特點是實體的屬性不能再分,映射到表中,就是列(或欄位)不能再分。
即:一個表中的列是不可再分的(即列的原子性)。
如表1.2,聯繫範式,對於學號‘1001’學生來說,‘聯繫方式’列包含電話和郵箱,可以再分,不符合第一範式要求。
如表1.3,列不可再分,符合了第一範式要求。
- 第二範式
如果關係模式R滿足第一範式,並且R得所有非主屬性都完全依賴於R的每一個候選關鍵屬性,稱R滿足第二範式,簡記為2NF。
如表1.3,姓名和選修課有對於關係,但是姓名和教材沒有對應關係,選修課程和教材有對對應關係,從而該表不符合第二範式標準。
將表修改後如表1.4和1.5,符合第二範式標準。
- 第三範式
如果關係模式R是2NF,且關係模式R(U,F)中的所有非主屬性對任何候選鍵都不存在傳遞依賴,則成關係R是屬於第三範式的模式。
如表1.6滿足2NF,但是知道班級後必然能知道該學生 屬於哪個系,所以存在傳遞依賴,不符合3NF規範,所以講班級和系別屬性拆分如表1.7,和1.8,從而符合3NF標準。
表1.6
學號 | 姓名 | 班級 | 系別 |
1001 | 張三 | 電腦科學與技術1班 | 電腦系 |
1002 | 李四 | 會計1班 | 經管系 |
學號 | 姓名 | 班級 |
1001 | 張三 | 電腦科學與技術1班 |
1002 | 李四 | 會計1班 |
班級 | 系別 |
電腦科學與技術1班 | 電腦系 |
會計1班 | 經管系 |
三大範式只是一般設計資料庫的基本理念,可以建立冗餘較小、結構合理的資料庫。如果有特殊情況,當然要特殊對待,資料庫設計最重要的是看需求跟性能,需求>性能>表結構。所以不能一味的去追求範式建立資料庫。