1、基本術語 1)信息:指數據加工處理後有用的數據。 2)信息的3種世界: (1)現實世界:存在於人腦之外的客觀世界。 (2)信息世界:現實世界在人腦中的反映。 (3)數據世界:將信息世界中的信息通過抽象和組織,按特定的數據結構,將數據存儲於電腦中。 3)數據:描述事物的符號記錄。 (1)數據處理 ...
1、基本術語
1)信息:指數據加工處理後有用的數據。
2)信息的3種世界:
(1)現實世界:存在於人腦之外的客觀世界。
(2)信息世界:現實世界在人腦中的反映。
(3)數據世界:將信息世界中的信息通過抽象和組織,按特定的數據結構,將數據存儲於電腦中。
3)數據:描述事物的符號記錄。
(1)數據處理:指對各種數據進行採集、存儲、檢索、加工、傳播和應用等一系列活動的總和。
(2)數據管理:對數據進行有效的分類、組織、編碼、存儲、檢索、維護和應用,是數據處理的中心問題。
(3)數據冗餘:指相同的數據在不同的地方重覆存儲。
(4)數據完整性:指數據的正確性、有效性、相容性,也稱為一致性約束。
4)資料庫
(1) 含義:長期存儲在電腦內的、有組織的、可共用的數據集合。
狹義:存儲數據的倉庫。
廣義:可以對數據進行存儲和管理的軟體以及數據本身統稱為資料庫。
資料庫是由表、關係、操作組成。
(2)資料庫特點:較小的冗餘度、較高的數據獨立性、易擴展性、可為各個用戶共用。
(3)資料庫技術:科學的組織和存儲數據、高效的獲取和處理數據。
(4)一個資料庫中包含三個文件:基本數據文件(主數據文件):.mdf 有且只有一個。
輔助數據文件:.ndf 可有可無可多個。
日誌文件:.ldf 至少一個。
(5)資料庫管理技術經歷的階段:人工管理階段、文件系統階段、資料庫管理階段。
(6)為什麼需要資料庫
幾乎所有的應用軟體的後臺都需要資料庫
資料庫存儲數據占用空間小,容易持久保存
存儲比較安全
容易維護和升級
資料庫移植比較容易
簡化對數據的操作
(7)有了編程語言為什麼還需要資料庫
對記憶體數據操作是編程語言的強項,但對硬碟數據操作卻是編程語言
對硬碟數據操作卻是資料庫的強項,是資料庫研究的核心問題
5)DBMS(資料庫管理系統):由一個相互關聯的數據的集合和一組用以訪問、管理和控制這些數據的程式組成。
(1)DBMS的用途:科學地組織和存儲數據、高效地獲取和維護數據。
(2)DBMS的特點:數據結構化、數據的共用度高、冗餘度低、易擴充、數據獨立性高、數據由資料庫管理系統統一管理和控制。
(3)DBMS的組成:模式更新、查詢、更新、查詢處理器、存儲管理器、事物管理器。
6)DBS(資料庫系統):DBS=DB+DBMS
(1)DBS的發展:網狀資料庫(網狀模型,圖形結構)
層次資料庫(層次模型,樹形結構)
關係資料庫(關係模型,簡單二維表結構)
(2)SQL(結構化查詢語言):專為資料庫而建立的操作命令集。
2、數據模型
1)根據數據抽象的不同級別,將數據模型劃分為3層:概念模型、邏輯模型、物理模型。
2)數據模型的組成:數據結構、數據操作、數據完整性。
(1)數據結構:描述資料庫的組成對象(實體)以及對象之間的聯繫,是對系統靜態特征的描述。
數據結構和資料庫的區別
資料庫是在應用軟體級別研究數據的存儲和操作
數據結構是在系統軟體級別研究數據的存儲和操作
(2)數據操作:指對資料庫中各個對象的實例允許執行的操作的集合,是對系統動態特征的描述。
(3)數據完整性約束(數據約束):對數據結構和數據操作的一致性、完整性約束。
3)概念模型
(1)概念模型是現實世界的第一層抽象。
(2)常見的概念模型:實體聯繫模型(E-R模型)、面對對象模型(OO模型)。
4)邏輯模型
(1)邏輯層:數據抽象的中間層,用於描述資料庫數據的整體邏輯結構,是現實世界的第二層抽象。
(2)邏輯層的數據抽象稱為邏輯數據模型(數據模型)。
(3)傳統的邏輯數據模型:層次模型、網狀模型、關係模型;非傳統的邏輯數據模型:面向對象模型(OO模型)、XML模型。
5)物理模型
(1)物理層:數據抽象的最底層,用於描述數據的物理存儲結構和存取方法。
(2)物理層的數據抽象稱為物理數據模型。
3、層次模型
1)層次模型用樹形結構來表示各類實體以及實體間的聯繫。
2)條件:有且僅有一個結點沒有雙親結點(根結點)、根以外的其他結點有且僅有一個雙親結點。
3)優點:數據結構簡單清晰、查詢效率高、提供了良好的數據完整性支持。
4)缺點:多對多聯繫表示不自然、查詢孩子結點必須通過雙親結點、由於結構嚴密層次命令區域程式化、對插入和刪除操作的限制多。
4、網狀模型
1)條件:允許一個以上的結點無雙親、一個結點可以有多個雙親。
2)優點:更直接的描述現實世界、存取效率高。
3)缺點:結構複雜、操作語言複雜。
5、關係模型
1)關係模型由一組關係組成,每個關係的數據結構是一張二維表,沒有重覆行、列。
2)常用術語
(1)關係:一個關係對應一張二維表。
(2)元組:表中的一行。
(3)屬性:表中的一列。
(4)碼(碼鍵):表中的某個屬性或屬性組,可以唯一標識表中的一行。
(5)域:屬性的取值範圍。
(6)分量:屬性的取值範圍。
(7)外碼:表中的某個屬性或屬性組,用於描述本關係中的元組與另一個關係中的元組之間的聯繫。
(8)關係模式:形式:關係名(屬性名1,屬性名2,...,屬性名n)。
6、數據抽象
1)物理層抽象:最低層次的抽象,描述數據實際上是如何存儲。
2)邏輯層抽象:中間層次的抽象,描述資料庫中存儲什麼數據以及這些數據之間存在什麼關係。
3)視圖層抽象:最高層次的抽象,只描述整個資料庫的某個部分。
7、資料庫的三級模式
1)模式:資料庫中全體數據的邏輯結構和特征的描述,僅涉及型的描述,不涉及具體的值。
2)實例:模式的一個具體值,同一個模式可以有很多實例。
3)三級模式結構:外模式、模式、內模式。
(1)外模式(子模式、用戶模式):對應於視圖層數據抽象,通常為模式的子集,數據的局部邏輯結構。
(2)模式(邏輯模式):對應於邏輯層數據抽象,是資料庫中全體數據的邏輯結構和特征描述,是用戶的公共數據視圖,資料庫管理系統模式結構的中間層,既不涉及數據的物理存儲細節和硬體環境,一個資料庫只有一個模式,數據的全局邏輯結構,一個模式可以有多個外模式。
(3)內模式(存儲模式):對應於物理層數據抽象,是數據的物理結構和存儲方式的描述,是數據在資料庫內部的表現方式,一個資料庫只有一個內模式。
8、資料庫的兩層映像
1)外模式/模式映象:定義了該外模式與模式之間的對應關係,保證了數據的邏輯獨立性。
2)模式/內模式映象:唯一的,定義了數據全局邏輯結構與存儲結構之間的對應關係,保證了數據的物理獨立性。