【資料庫概論】第二章 關係型資料庫

来源:https://www.cnblogs.com/cyra/archive/2023/12/06/17878937.html
-Advertisement-
Play Games

資料庫關係模型是數據組織的核心,以關係為基礎,表達實體和實體關係。關係模型通過域、笛卡爾積、關係模式構建二維表,形成資料庫。完整性約束確保數據有效性,實體完整性、參照完整性和用戶定義完整性保證數據質量。關係操作包括基本操作和數據語言,而關係代數提供了強大的查詢手段。資料庫關係模型為信息管理提供了結構... ...


2.1 關係資料庫

2.1.1關係

關係模型的數據結構十分簡單,只包含單一的數據結構——關係。在用戶看來,關係模型中數據的邏輯結構是一張扁平的二維表。關係模型的數據結構雖然簡單卻能表達豐富的語義。在關係模型中,現實世界的實體以及實體之間的聯機都是用單一的關係結構類型來表示。

  1. 域(domain)
    定義:域是一組具有相同數據類型的值的集合。例如學生資料庫中所有的學生名字,或者性別的取值只有男或女,這就是性別的域。

  2. 笛卡爾積
    在一組域D1,D2,D3…Dn中的笛卡爾積是:D1xD2xD3…Dn 。其中每一個元素(d1,d2,d3,…dn)稱為一個n元組,元素中每一個di稱之為一個分量一個域允許的不同取址的個數稱為這個域的基數。笛卡爾積可以表示為一個二位表,表中的每一列來自一個域。
    笛卡爾積

  3. 關係
    D1xD2xD3x…xDn的子集叫做在域D1,D2,D3…Dn上的關係,表示為R(D1,D2,D3…Dn),R表示關係的名字,n是關係的。比如一個實體:學生(學號,姓名,班級,院系),其中R為學生,n為4。

關係中每個元素是關係中的元組,使用t來表示。關係是笛卡爾積的有限子集,表的每一行對應一個元組,表的每一列對應一個域。由於域可以相同,為了區分,必須給每一列起一個名字,稱之為屬性。n目關係有n個屬性。

如果關係中某一屬性的值能夠唯一的標識一個元組,而其子集不能,則稱該屬性組為候選碼(比如學生表中的學號,通過學號可以確定是哪個學生,但是靠班級或者性別是不行的)。如果一個關係中有多個候選碼,則可以選擇其中一個作為主碼(primary key)。候選碼的各個屬性稱為主屬性。不包含在任何候選碼中的屬性稱為非主屬性。在最簡單的情況下,關係模式所有的屬性都是這個關係模式的候選碼,稱為全碼

關係可以有三種類型:基本關係、查詢表和視圖表。基本關係就是實際存在的表;查詢表是查詢結果對應的表;視圖表是由基本表或其它視圖表導出的表,是虛表,不對應實際存儲的數據。

因此,基本關係具有一下六條性質:
(1)列是同質的,也就是每一列中的數據都是同一類型的來自同一個域的
(2)不同的列可能來自同一個域,稱每個列為一個屬性。比如學生的出生年份和入學年份兩個不同的屬性是來自同一個域的
(3)列的順序無所謂,次序可以交換
(4)任意兩個元組的候選慢不能取相同的值
(5)行的順序也無所謂
(6)分量必須取原子值,每一個分量必須是不可分的數據項

關係模型中要求關係必須是規範化的,滿足上述條件的。規範化的關係簡稱為範式(Normal Form,NF)

2.1.2關係模式

關係是元組的集合,因此關係模式必須指出這個元組集合的結構。關係的描述稱為關係模式,可表示為:

R(U,D,DOM,F)
R為關係名,U為組成該關係的屬性名集合,D為U中屬性來自的域,DOM為屬性向域的映像集合,F為屬性間數據的依賴關係集合。

2.1.3關係資料庫

在一個給定的應用領域中,所有關係的集合構成一個關係資料庫。

關係資料庫的型又稱為關係數據路模式,是對關係資料庫的描述。關係資料庫模式包含若幹域的定義。

2.2 關係操作

2.2.1 基本的關係操作

常用的關係操作包括查詢(query)、插入(insert)、刪除(delete)和修改(update)。關係的查詢表達能力強,查詢的基本操作是選擇(select)、投影(project)、連接(join)、除(divide)、並(union)、差(except)、交和笛卡爾積,這些在後面都會介紹。關係操作的特點是集合操作方式,就是操作的對象和結果都是集合。這部分會在後面詳細介紹

2.2.2關係數據語言的分類

早期的關係操作能力通常用代數方式活著邏輯方式來表示,分別稱為關係代數關係演算。關係代數用對關係的運算來表達查詢需求,關係元算則使用謂語來表達查詢要求。另外還有一種介於關係代數和關係演算之間的結構化查詢語言(SQL),具有豐富的查詢功能,是集查詢、數據定義和數據控制語言於一體的關係數據語言。我們的重點是在於學習SQL語言。

2.3 關係的完整性

關係模型中有三類完整性約束:實體完整性、參照完整性和用戶定義的完整性

2.3.1 實體完整性

實體完整性規則:如果屬性A是基本關係R的主屬性(主鍵),則A不能取空值。比如學生(學號、姓名、專業號、班級號)這個表中學號為主碼,則學號不可為空。

規則說明如下:

  • 實體完整性規則是針對基本關係而言的,一個基本表通常對應現實世界的一個實體集合(比如學生表集合對應現實中的所有學生)
  • 現實世界中的實體是可以區分的,也就是他們是具有某種唯一的標識的,錄入每個學生都是獨立的個體。相應的,關係模型中以主碼為唯一性標識。
  • 因此主碼中的屬性不能取空值,主碼為空意味著該實體無法被唯一的標識,也就是該實體是無法被區分的。

也就是在學生表中,為了區分學生,必須要求作為主鍵的學號不能為空,如果學號為空,那麼一旦出現重名的學生,就會無法區分兩個學生,從而使得關係資料庫出現邏輯錯誤。總之,實體完整性要求主鍵不能取空值。

2.3.2 參照完整性

現實世界之中實體之間往往存在某種聯繫,在關係模型中實體和實體之間的聯繫也是用關係來描述的。比如學生的班級號和班級表中的班級號是有聯繫的。因此定義了一種參考關係來說明實體和實體之間的聯繫,先看如下例子

比如有如下兩個表:

學生(學號、姓名、班級號、專業號)
專業(專業號、專業名)

那麼學生表的專業號信息均來自於專業表,那麼學生表中就不可以出現專業表中不存在的專業。

定義:設F是基本關係R的一個或一組屬性,但是不是R的主碼,K是基本關係S的主碼。如果F和K相對應,則稱F是R的外碼(Foreign Key),並且稱R為參照關係,S為被參照關係或目標關係。

參照完整性規則是定義外碼和主碼之間的引用關係:
若屬性或者屬性組F是基本關係R的外碼,他和基本關係S的主碼K相對應,則對於R中每個元組在F上的只必須:

  • 或者取空值(F中的每個屬性值都是空值)
  • 或者等於S中某個元組的主碼值

回到剛纔的兩個表,其中學生表中的專業號和專業表中的專業號之間有外鍵關係:

學生(學號、姓名、班級號、專業號)
專業(專業號、專業名)

學生表中的“專業號”屬性是參照專業表中的“專業號”的,那麼可以有兩種情況:

  • 空值,表示還沒有給學生分配專業
  • 非空,但是值必須是專業表中存在的值
    也就是不可以出現不存在的專業號

2.3.3 用戶定義的完整性

用戶定義的完整性是針對某一具體關係資料庫的約束條件,反應某一具體應用所涉及的數據必須滿足語義要求。比如說規定學生成績不可以有負數等等。在很早之前的關係資料庫管理系統是沒有提供定義和檢驗這些完整性的功能,所有都需要應用程式編寫者負責,麻煩而且安全性不夠高。

2.4 關係代數

關係代數是一種抽象的查詢語言,他用對關係的運算來表達查詢。關係代數的運算可以分為傳統集合運算和專門的關係運算兩種類型。其中傳統的集合運算將關係看成元組的集合,其運算是從行角度進行的;而專門電費集合關係運算不僅涉及行,而且涉及列。

2.4.1 傳統集合運算

傳統集合運算是二目運算,包含並、交、差、笛卡爾積四種。我們設計兩個表R和S
傳統集合運算舉例

  1. 並集(Union)
    並集使用 ∪ 表示,其中 (R ∪ S) 表示 R 和 S 的並集,見圖c。並集運算是將兩個集合中出現的行組成一張新表,由屬於 R 或屬於 S 的行組成。
  2. 交集(intersection)
    交集使用 ∩ 標識,其中R ∩ S 表示 R 和 S 的交集,見圖d。交集運算是將兩個集合中的公共行組合成一張新表,由既屬於 R 又屬於 S 的行組成。
  3. 差(expect)
    差集使用 − 表示,其中 R − S 表示 R 和 S 的差,見圖e。差運算是提取屬於 R 但不屬於 S 的行。
  4. 笛卡爾積(cartesian product)
    R × S 表示 R 和 S 的笛卡爾積,如圖f所示,R 和 S 的笛卡爾積是一個 n+m 列的元素的集合。元素的前 n 列是關係 R 的一個元組,後 m 列是關係 S 的一個元組。

2.4.2 專門的關係運算

專門關係運算包括選擇、投影、連接、除運算。

1.選擇(Selection)

選擇又稱為限制,在關係R中選擇滿足給定條件的元組。比如說查詢學生表中年齡大於20的學生

2.投影(Projection)

關係R上的投影上是從R中選擇若幹屬性列組成新關係。比如在學生(學號,姓名,班級,專業)這個關係中,選擇學號和姓名兩列組成新關係。

3.連接(Join)

連接是從兩個關係的笛卡爾積中選取屬性之間滿足一定條件的元組。連接分為等值連接、非等值連接和自然連接,其區別可以看下圖,下圖是對R中的B列和S中的B列進行等值、非等值和自然連接。其中:

  1. 等值連接會從關係R和S的廣義笛卡爾積中選取A、B屬性值相等的元組。
  2. 非等值連接則可以使用大於或等於進行連接。
  3. 自然連接是一種特殊的等值連接,他要求兩個關係中進行比較的屬性必須是同名的屬性組,並且在結果中將重覆的屬性列去掉。
    連接運算舉例
    兩個關係R和S進行自然連接的時候,選擇兩個關係在公共屬性上等值的元組構成新的關係。此時關係R中某些元組可能在S中不存在公共屬性上相等的元組,從而造成R中這些元組被捨棄了,同樣地,S中某些元組也會被捨棄。這些被捨棄的數組稱為懸浮數組
    如果把懸浮數組也保存在結果關係中,而在其他屬性上填上空值NULL,那麼這種連接稱之為外連接。在進行R join S的時候,只保留左邊關係R中的懸浮數組稱為左外連接(left join),只保留右邊關係S中的懸浮數組稱為右外連接(right join)
    外連接運算舉例
    左外連接=自然連接+左側表的失配元組(與空元組連接)
    右外連接=自然連接+右側表的失配元組(與空元組連接)
    全外連接=自然連接+兩側表的失配元組(與空元組連接)
  4. 除運算(division)
    設關係R除以關係S的結果為T,則T包含所有在R但是不在S中的屬性以及其值,而且T的元組和S的元組的所有集合都在R中。

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ssh介紹 SSH,全稱為Secure Shell,是一種用於在網路中安全地進行遠程登錄和執行命令的協議。它通過加密的方式提供了對網路通信的保護,使得用戶可以在不安全的網路環境下安全地進行遠程管理和數據傳輸。 以下是 SSH 協議的一些重要特點和功能: 安全性:SSH 使用加密技術來保護數據在網路中 ...
  • 資料庫完整性包括正確性和相容性,DBMS通過提供約束條件機制、檢查方法和違約處理功能維護資料庫完整性,其中實體完整性通過主鍵確保唯一標識,參照實體性通過外鍵關聯,用戶定義完整性滿足特定應用需求,而觸發器和斷言提供事件驅動和複雜約束支持,共同構成資料庫保持一致性的關鍵機制。 ...
  • SQL(結構化查詢語言)的演變從IBM的SystemR開始,經過ANSI的標準化,近年來SQL標準變得更加豐富和複雜。SQL的特點包括綜合統一、高度非過程化、面向集合的操作方式以及提供多種使用方式的統一語法結構。在資料庫實例中,基本表獨立存在,而視圖是基本表導出的虛表,用於供人查看。資料庫模式結構包... ...
  • SQL ALTER TABLE 語句 SQL ALTER TABLE 語句用於在現有表中添加、刪除或修改列,也可用於添加和刪除各種約束。 ALTER TABLE - 添加列 要在表中添加列,請使用以下語法: ALTER TABLE 表名 ADD 列名 數據類型; 以下 SQL 向 "Customer ...
  • 本文分享自華為雲社區《GaussDB資料庫SQL系列-SQL與ETL淺談》,作者:Gauss松鼠會小助手2。 一、前言 在SQL語言中,ETL(抽取、轉換和載入)是一種用於將數據從源系統抽取到目標系統的過程。ETL過程通常包括三個階段:抽取(Extract)、轉換(Transform)和載入(Loa ...
  • 數據作為新時代重要的生產要素之一,數據資產化的相關工作正在提速。自今年10月1日起,中國資產評估協會制定的《數據資產評估指導意見》正式施行。同時,《企業數據資源相關會計處理暫行規定》近期轉為正式稿,也將於明年1月1日起施行。 《暫行規定》規定:企業使用的數據資源,符合《企業會計準則第6號——無形資產 ...
  • 解耦、削峰:傳統的方式上游發送數據下游需要實時接收,如果上游在某些業務場景:例如上午十點會流量激增至頂峰,那麼下游資源可能會扛不住壓力。但如果使用消息隊列,就可以將消息暫存在消息管道中,下游可以按照自己的速度逐步處理; ...
  • 大數據框架下,常用的數據更新策略有三種: COW: copy-on-write, 寫時複製; MOR: merge-on-read, 讀時合併; MOW: merge-on-write, 寫時合併; hudi等數據湖倉框架,常用的是前兩種實現數據更新。而Doris則主要用後兩種更新數據。 COW 在 ...
一周排行
    -Advertisement-
    Play Games
  • 背景 在瀏覽器中訪問本地靜態資源html網頁時,可能會遇到跨域問題如圖。 是因為瀏覽器預設啟用了同源策略,即只允許載入與當前網頁具有相同源(協議、功能變數名稱和埠)的內容。 WebView2預設情況下啟用了瀏覽器的同源策略,即只允許載入與主機相同源的內容。所以如果我們把靜態資源發佈到iis或者通過node ...
  • 最近看幾個老項目的SQL條件中使用了1=1,想想自己也曾經這樣寫過,略有感觸,特別拿出來說道說道。編寫SQL語句就像炒菜,每一種調料的使用都會影響菜品的最終味道,每一個SQL條件的加入也會影響查詢的執行效率。那麼 1=1 存在什麼樣的問題呢?為什麼又會使用呢? ...
  • 好久不見,我又回來了。 給大家分享一個我最近使用c#代碼操作ftp伺服器的代碼示例: 1 public abstract class FtpOperation 2 { 3 /// <summary> 4 /// FTP伺服器地址 5 /// </summary> 6 private string f ...
  • 一:背景 1. 講故事 過年喝了不少酒,腦子不靈光了,停了將近一個月沒寫博客,今天就當新年開工寫一篇吧。 去年年初有位朋友找到我,說他們的系統會偶發性崩潰,在網上也發了不少帖子求助,沒找到自己滿意的答案,讓我看看有沒有什麼線索,看樣子這是一個牛皮蘚的問題,既然對方有了dump,那就分析起來吧。 二: ...
  • 自己製作的一個基於Entity Framework Core 的資料庫操作攔截器,可以列印資料庫執行sql,方便開發調試,代碼如下: /// <summary> /// EF Core 的資料庫操作攔截器,用於在資料庫操作過程中進行日誌記錄和監視。 /// </summary> /// <remar ...
  • 本文分享自華為雲社區《Go併發範式 流水線和優雅退出 Pipeline 與 Cancellation》,作者:張儉。 介紹 Go 的併發原語可以輕鬆構建流數據管道,從而高效利用 I/O 和多個 CPU。 本文展示了此類pipelines的示例,強調了操作失敗時出現的細微之處,並介紹了乾凈地處理失敗的 ...
  • 在上篇文章中,我們介紹到在多線程環境下,如果編程不當,可能會出現程式運行結果混亂的問題。出現這個原因主要是,JMM 中主記憶體和線程工作記憶體的數據不一致,以及多個線程執行時無序,共同導致的結果。 ...
  • 1、下載安裝包首先、進入官網下載安裝包網址:https://www.python.org/downloads/windows/下載步驟:進入下載地址,根據自己的電腦系統選擇相應的python版本 選擇適配64位操作系統的版本(查看自己的電腦操作系統版本), 點擊下載安裝包 也可以下載我百度雲分享的安 ...
  • 簡介 git-commit-id-maven-plugin 是一個maven 插件,用來在打包的時候將git-commit 信息打進jar中。 這樣做的好處是可以將發佈的某版本和對應的代碼關聯起來,方便查閱和線上項目的維護。至於它的作用,用官方說法,這個功能對於大型分散式項目來說是無價的。 功能 你 ...
  • 序言 在數字時代,圖像生成技術正日益成為人工智慧領域的熱點。 本討論將重點聚焦於兩個備受矚目的模型:DALL-E和其他主流AI繪圖方法。 我們將探討它們的優勢、局限性以及未來的發展方向。通過比較分析,我們期望能夠更全面地瞭解這些技術,為未來的研究和應用提供啟示。 Q: 介紹一下 dall-e Ope ...