資料庫關係模型是數據組織的核心,以關係為基礎,表達實體和實體關係。關係模型通過域、笛卡爾積、關係模式構建二維表,形成資料庫。完整性約束確保數據有效性,實體完整性、參照完整性和用戶定義完整性保證數據質量。關係操作包括基本操作和數據語言,而關係代數提供了強大的查詢手段。資料庫關係模型為信息管理提供了結構... ...
2.1 關係資料庫
2.1.1關係
關係模型的數據結構十分簡單,只包含單一的數據結構——關係。在用戶看來,關係模型中數據的邏輯結構是一張扁平的二維表。關係模型的數據結構雖然簡單卻能表達豐富的語義。在關係模型中,現實世界的實體以及實體之間的聯機都是用單一的關係結構類型來表示。
-
域(domain)
定義:域是一組具有相同數據類型的值的集合。例如學生資料庫中所有的學生名字,或者性別的取值只有男或女,這就是性別的域。 -
笛卡爾積
在一組域D1,D2,D3…Dn中的笛卡爾積是:D1xD2xD3…Dn 。其中每一個元素(d1,d2,d3,…dn)稱為一個n元組,元素中每一個di稱之為一個分量一個域允許的不同取址的個數稱為這個域的基數。笛卡爾積可以表示為一個二位表,表中的每一列來自一個域。
-
關係
D1xD2xD3x…xDn的子集叫做在域D1,D2,D3…Dn上的關係,表示為R(D1,D2,D3…Dn),R表示關係的名字,n是關係的目和度。比如一個實體:學生(學號,姓名,班級,院系),其中R為學生,n為4。
關係中每個元素是關係中的元組,使用t來表示。關係是笛卡爾積的有限子集,表的每一行對應一個元組,表的每一列對應一個域。由於域可以相同,為了區分,必須給每一列起一個名字,稱之為屬性。n目關係有n個屬性。
如果關係中某一屬性的值能夠唯一的標識一個元組,而其子集不能,則稱該屬性組為候選碼(比如學生表中的學號,通過學號可以確定是哪個學生,但是靠班級或者性別是不行的)。如果一個關係中有多個候選碼,則可以選擇其中一個作為主碼(primary key)。候選碼的各個屬性稱為主屬性。不包含在任何候選碼中的屬性稱為非主屬性。在最簡單的情況下,關係模式所有的屬性都是這個關係模式的候選碼,稱為全碼。
關係可以有三種類型:基本關係、查詢表和視圖表。基本關係就是實際存在的表;查詢表是查詢結果對應的表;視圖表是由基本表或其它視圖表導出的表,是虛表,不對應實際存儲的數據。
因此,基本關係具有一下六條性質:
(1)列是同質的,也就是每一列中的數據都是同一類型的來自同一個域的
(2)不同的列可能來自同一個域,稱每個列為一個屬性。比如學生的出生年份和入學年份兩個不同的屬性是來自同一個域的
(3)列的順序無所謂,次序可以交換
(4)任意兩個元組的候選慢不能取相同的值
(5)行的順序也無所謂
(6)分量必須取原子值,每一個分量必須是不可分的數據項
關係模型中要求關係必須是規範化的,滿足上述條件的。規範化的關係簡稱為範式(Normal Form,NF)
2.1.2關係模式
關係是元組的集合,因此關係模式必須指出這個元組集合的結構。關係的描述稱為關係模式,可表示為:
R(U,D,DOM,F)
R為關係名,U為組成該關係的屬性名集合,D為U中屬性來自的域,DOM為屬性向域的映像集合,F為屬性間數據的依賴關係集合。
2.1.3關係資料庫
在一個給定的應用領域中,所有關係的集合構成一個關係資料庫。
關係資料庫的型又稱為關係數據路模式,是對關係資料庫的描述。關係資料庫模式包含若幹域的定義。
2.2 關係操作
2.2.1 基本的關係操作
常用的關係操作包括查詢(query)、插入(insert)、刪除(delete)和修改(update)。關係的查詢表達能力強,查詢的基本操作是選擇(select)、投影(project)、連接(join)、除(divide)、並(union)、差(except)、交和笛卡爾積,這些在後面都會介紹。關係操作的特點是集合操作方式,就是操作的對象和結果都是集合。這部分會在後面詳細介紹
2.2.2關係數據語言的分類
早期的關係操作能力通常用代數方式活著邏輯方式來表示,分別稱為關係代數和關係演算。關係代數用對關係的運算來表達查詢需求,關係元算則使用謂語來表達查詢要求。另外還有一種介於關係代數和關係演算之間的結構化查詢語言(SQL),具有豐富的查詢功能,是集查詢、數據定義和數據控制語言於一體的關係數據語言。我們的重點是在於學習SQL語言。
2.3 關係的完整性
關係模型中有三類完整性約束:實體完整性、參照完整性和用戶定義的完整性
2.3.1 實體完整性
實體完整性規則:如果屬性A是基本關係R的主屬性(主鍵),則A不能取空值。比如學生(學號、姓名、專業號、班級號)這個表中學號為主碼,則學號不可為空。
規則說明如下:
- 實體完整性規則是針對基本關係而言的,一個基本表通常對應現實世界的一個實體集合(比如學生表集合對應現實中的所有學生)
- 現實世界中的實體是可以區分的,也就是他們是具有某種唯一的標識的,錄入每個學生都是獨立的個體。相應的,關係模型中以主碼為唯一性標識。
- 因此主碼中的屬性不能取空值,主碼為空意味著該實體無法被唯一的標識,也就是該實體是無法被區分的。
也就是在學生表中,為了區分學生,必須要求作為主鍵的學號不能為空,如果學號為空,那麼一旦出現重名的學生,就會無法區分兩個學生,從而使得關係資料庫出現邏輯錯誤。總之,實體完整性要求主鍵不能取空值。
2.3.2 參照完整性
現實世界之中實體之間往往存在某種聯繫,在關係模型中實體和實體之間的聯繫也是用關係來描述的。比如學生的班級號和班級表中的班級號是有聯繫的。因此定義了一種參考關係來說明實體和實體之間的聯繫,先看如下例子
比如有如下兩個表:
學生(學號、姓名、班級號、專業號)
專業(專業號、專業名)
那麼學生表的專業號信息均來自於專業表,那麼學生表中就不可以出現專業表中不存在的專業。
定義:設F是基本關係R的一個或一組屬性,但是不是R的主碼,K是基本關係S的主碼。如果F和K相對應,則稱F是R的外碼(Foreign Key),並且稱R為參照關係,S為被參照關係或目標關係。
參照完整性規則是定義外碼和主碼之間的引用關係:
若屬性或者屬性組F是基本關係R的外碼,他和基本關係S的主碼K相對應,則對於R中每個元組在F上的只必須:
- 或者取空值(F中的每個屬性值都是空值)
- 或者等於S中某個元組的主碼值
回到剛纔的兩個表,其中學生表中的專業號和專業表中的專業號之間有外鍵關係:
學生(學號、姓名、班級號、專業號)
專業(專業號、專業名)
學生表中的“專業號”屬性是參照專業表中的“專業號”的,那麼可以有兩種情況:
- 空值,表示還沒有給學生分配專業
- 非空,但是值必須是專業表中存在的值
也就是不可以出現不存在的專業號
2.3.3 用戶定義的完整性
用戶定義的完整性是針對某一具體關係資料庫的約束條件,反應某一具體應用所涉及的數據必須滿足語義要求。比如說規定學生成績不可以有負數等等。在很早之前的關係資料庫管理系統是沒有提供定義和檢驗這些完整性的功能,所有都需要應用程式編寫者負責,麻煩而且安全性不夠高。
2.4 關係代數
關係代數是一種抽象的查詢語言,他用對關係的運算來表達查詢。關係代數的運算可以分為傳統集合運算和專門的關係運算兩種類型。其中傳統的集合運算將關係看成元組的集合,其運算是從行角度進行的;而專門電費集合關係運算不僅涉及行,而且涉及列。
2.4.1 傳統集合運算
傳統集合運算是二目運算,包含並、交、差、笛卡爾積四種。我們設計兩個表R和S
- 並集(Union)
並集使用 ∪ 表示,其中 (R ∪ S) 表示 R 和 S 的並集,見圖c。並集運算是將兩個集合中出現的行組成一張新表,由屬於 R 或屬於 S 的行組成。 - 交集(intersection)
交集使用 ∩ 標識,其中R ∩ S 表示 R 和 S 的交集,見圖d。交集運算是將兩個集合中的公共行組合成一張新表,由既屬於 R 又屬於 S 的行組成。 - 差(expect)
差集使用 − 表示,其中 R − S 表示 R 和 S 的差,見圖e。差運算是提取屬於 R 但不屬於 S 的行。 - 笛卡爾積(cartesian product)
R × S 表示 R 和 S 的笛卡爾積,如圖f所示,R 和 S 的笛卡爾積是一個 n+m 列的元素的集合。元素的前 n 列是關係 R 的一個元組,後 m 列是關係 S 的一個元組。
2.4.2 專門的關係運算
專門關係運算包括選擇、投影、連接、除運算。
1.選擇(Selection)
選擇又稱為限制,在關係R中選擇滿足給定條件的元組。比如說查詢學生表中年齡大於20的學生
2.投影(Projection)
關係R上的投影上是從R中選擇若幹屬性列組成新關係。比如在學生(學號,姓名,班級,專業)這個關係中,選擇學號和姓名兩列組成新關係。
3.連接(Join)
連接是從兩個關係的笛卡爾積中選取屬性之間滿足一定條件的元組。連接分為等值連接、非等值連接和自然連接,其區別可以看下圖,下圖是對R中的B列和S中的B列進行等值、非等值和自然連接。其中:
- 等值連接會從關係R和S的廣義笛卡爾積中選取A、B屬性值相等的元組。
- 非等值連接則可以使用大於或等於進行連接。
- 自然連接是一種特殊的等值連接,他要求兩個關係中進行比較的屬性必須是同名的屬性組,並且在結果中將重覆的屬性列去掉。
兩個關係R和S進行自然連接的時候,選擇兩個關係在公共屬性上等值的元組構成新的關係。此時關係R中某些元組可能在S中不存在公共屬性上相等的元組,從而造成R中這些元組被捨棄了,同樣地,S中某些元組也會被捨棄。這些被捨棄的數組稱為懸浮數組。
如果把懸浮數組也保存在結果關係中,而在其他屬性上填上空值NULL,那麼這種連接稱之為外連接。在進行R join S的時候,只保留左邊關係R中的懸浮數組稱為左外連接(left join),只保留右邊關係S中的懸浮數組稱為右外連接(right join)
左外連接=自然連接+左側表的失配元組(與空元組連接)
右外連接=自然連接+右側表的失配元組(與空元組連接)
全外連接=自然連接+兩側表的失配元組(與空元組連接) - 除運算(division)
設關係R除以關係S的結果為T,則T包含所有在R但是不在S中的屬性以及其值,而且T的元組和S的元組的所有集合都在R中。