資料庫的相關介紹 ...
資料庫的相關介紹
文件管理系統的缺點:
編寫應用程式不方便
數據冗餘不可避免
應用程式依賴性
不支持對文件的併發訪問
數據間聯繫弱
難以按用戶視圖表示數據
資料庫管理系統的優點:
相互關聯的數據的集合
較少的數據冗餘
程式與數據相互獨立
保證數據的安全、可靠
最大限度地保證數據的正確性
數據可以併發使用並能同時保證一致性
資料庫管理系統
資料庫是數據的彙集,它以一定的組織形式存於存儲介質上。
DBMS是管理資料庫的系統軟體,它實現資料庫系統的各種功能,是資料庫系統的核心。
DBA負責資料庫的規劃、設計、協調、維護和管理等工作。
應用程式:指以資料庫為基礎的應用程式
資料庫管理系統的基本功能
數據定義
數據處理
數據安全
數據備份
資料庫系統的架構
單機架構
大型主機/終端架構
主從式架構(C/S)
分散式架構
實體- 聯繫模型E-R
實體Entity:
客觀存在並可以相互區分的客觀事物或抽象事件稱為實體。
在E-R 圖中用矩形框表示實體,把實體名寫在框內
屬性:
實體所具有的特征或性質
聯繫:
聯繫是數據之間的關聯集合,是客觀存在的應用語義鏈
實體內部的聯繫:指組成實體的各屬性之間的聯繫。如職工,實體中職工號和部門經理號之間有一種關聯關係
實體之間的聯繫:指不同實體之間聯繫。例學生選課實體和學生基本信息實體之間
聯繫的類型:
一對一聯繫(1:1)
一對多聯繫(1:n)
多對多聯繫(m:n)
數據三要素
數據結構:
一類是與數據類型、內容、性質有關的對象,比如關係模型中的域、屬性和關係等;
另一類是與數據之間聯繫有關的對象,它從數據組織層表達數據記錄與欄位的結構
數據的操作:
數據提取:在數據集合中提取感興趣的內容。(SELECT)
數據更新:變更資料庫中的數據。(INSERT 、DELETE、UPDATE)
數據的約束條件:是一組完整性規則的集合
實體(行)完整性 Entity integrity
域(列)完整性 Domain Integrity
參考完整性 Referential Integrity
簡易數據規劃流程
第一階段:
集數據,得到欄位
收集必要且完整的數據項
轉換成數據表的欄位
第二階段:
把欄位分類,歸入表,建立表的關聯
關聯:表和表間的關係
分割數據表並建立關聯的優點
節省空間
減少輸入錯誤
方便數據修改
第三階段:
規範化資料庫
資料庫的正規化分析
RDMBS設計範式基礎概念
設計關係資料庫時,遵從不同的規範要求,設計出合理的關係型資料庫,這些不同的規範要求被稱為不同的範式,各種範式呈遞次規範,越高的範式資料庫冗餘越小。
目前關係資料庫有六種範式:
第一範式(1NF)、第二範式(2NF)、第三範式(3NF)、巴德斯科範式(BCNF)、第四範式(4NF)和第五範式(5NF ,又稱完美範式)。
滿足最低要求的範式是第一範式(1NF)。在第一範式的基礎上進一步滿足更多規範要求的稱為第二範式(2NF ),其餘範式以次類推。一般說來,資料庫只需滿足第三範式(3NF)
範式:
1NF:每一列都是不可分割的基本數據項,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重覆的屬性。除去同類型的欄位,就是無重覆的列
2NF:第二範式必須先滿足第一範式,要求表中的每個行必須可以被唯一地區分。通常為表加上一個列,以存儲各個實例的唯一標識PK。非PK 的欄位需要與整個PK 有直接相關性
3NF:滿足第三範式必須先滿足第二範式。第三範式要求一個資料庫表中不包含已在其它表中已包含的非主關鍵字信息,非PK
SQL 概念
SQL: Structure Query Language
結構化查詢語言
SQL解釋器
數據存儲協議:應用層協議,C/S
S :server, 監聽於套接字,接收並處理客戶端的應用請求
C :Client
程式介面
CLI
GUI
應用編程介面
ODBC :Open Database Connectivity
JDBC :Java Data Base Connectivity
約束
約束:constraint,表中的數據要遵守的限制
主鍵:一個或多個欄位的組合,填入的數據必須能在本表中唯一標識本行;必須提供數據,即NOT NULL ,一個表只能存在一個
唯一鍵:一個或多個欄位的組合,填入的數據必須能在本表中唯一標識本行;允許為NULL ,一個表可以存在多個
外鍵:一個表中的某欄位可填入的數據取決於另一個表的主鍵或唯一鍵已有的數據
檢查:欄位值在一定範圍內
索引
將表中的一個或多個欄位中的數據複製一份另存,並且此些需要按特定次序排序存儲
索引是特殊數據結構,定義在查找時作為查找條件的欄位
優點:提高查詢速度
缺點:占用額外空間,影響插入速度
創建索引必須要有索引名稱
關係運算:
選擇:挑選出符合條件的行
投影:挑選出需要的欄位
連接:表間欄位的關聯
數據模型
數據抽象:
物理層:決定數據的存儲格式,即RDBMS 在磁碟上如何組織文件
邏輯層:描述存儲什麼數據,以及數據間存在什麼樣的關係
視圖層:描述DB中的部分數據
關係模型的分類:
基於對象的關係模型
半結構化的關係模型:XML
資料庫對象的命名規則
必須以字母開頭
可包括數字和三個特殊字元(#,_ ,$)
不要使用MySQL的保留字
同一Schema下的對象不能同名
資料庫基本概念
1)數據:記錄的信息
2)表:記錄信息被組織在一起的形式
3)資料庫:表的集合,是個存儲相互有關數據的倉庫
4)資料庫管理系統(database management system,DBMS):實現對資料庫有效管理的系統軟體。
5)資料庫系統(database system ,DBS):是一個交互系統,有硬體、操作系統、資料庫、DBMS、應用軟體和資料庫用戶組成。
關係型資料庫
1)關係型資料庫是基於關係模型的資料庫,基本概念來自於關係模型。
關係就是二維表,並滿足性質是,表中的行、列次序並不重要。
關係模型建立在關係代數的理論基礎上,數據結構使用簡易的二維數據表,可用簡單的“實體-關係(E-R)”圖來直接表示。
E-R圖包含了實體(數據對象)、關係和屬性三個要素。
2)關係資料庫存儲結構是二維表格,反映事物及其相關聯數據是以表格形式保存。
在每個二維表中,每行(row)稱為一條記錄,用來描述一個對象的信息,每列(column)稱為一個欄位,用來描述對象的一個屬性。
3)關係型資料庫的主鍵、域和事務。
主鍵(Primary key)是用於唯一確定一個記錄的欄位。
域(domain)是屬性的取值範圍,如性別隻能是‘男’和‘女’兩個值。
事務(transaction)是多個操作被當作一個整體對待。
4)關係型資料庫的常見組件
資料庫:database
表:table
行:row
列:column
索引:index
視圖:view
用戶:user
許可權:privilege
存儲過程:procedure ,過程無返回值
存儲函數:function ,過程有返回值
觸發器:trigger
事件調度器:event scheduler ,任務計劃
5)當今主流的關係型資料庫
1》SQLServer(微軟的):面向window系統,簡單易用。
2》oracle:面向所有主流平臺,安全、完善但操作複雜。
3》DB2(IBM公司的):面向所有主流平臺,大型、安全和完善的
4》MySQL(甲骨文收購):免費、開源、體積小
非關係資料庫
1)非關係資料庫被稱為NoSQL(not only SQL),存儲數據不以關係模型為依據,不需要固定的表格式。
它是作為關係資料庫的一個補充,發揮著高效率和高性能。
2)非關係型資料庫的優點
1》可滿足資料庫高併發讀寫的需求
2》滿足對海量數據高效率存儲與訪問
3》滿足資料庫高擴展性與高可用性的需求
3)非關係型資料庫的存儲方式
1》鍵-值方式,以鍵為依據存儲、刪除、更改數據
2》列存儲(column-oriented),將關係的數據存儲在列族中
3》文檔方式,資料庫有一些列數據項組成,每個數據項都有對應的值
4》圖形方式,實體為頂點,關係為變,數據保存為一個圖形。
4)非關係資料庫產品
1》memcached:
是一個緩存系統,以key-value方式存儲數據,可以緩存數據以減輕資料庫壓力並能加快訪問速度,加速動態web應用,緩存的內容存儲在記憶體中。
2》redis
也是一個以key-value方式存儲數據,數據也保存在記憶體中,但定期會將數據寫入磁碟中。
特點有:支持記憶體緩存,支持持久化,數據類型更多,支持集群和分散式,支持隊列。
應用示例有:資料庫前端緩存,session共用,用於需要緩存除了key-value之外的更多數據的時候,用於緩存的數據需要長久保存的時候。
RDBMS
DBMS ---> RDBMS
範式:
第一範式、第二範式、第三範式
表:
row(行), column(列);
關係運算:
選擇
投影
資料庫:
表、索引、視圖(虛表)、sql、存儲過程、存儲函數、觸發器、事件調度器;
約束:
主鍵約束:唯一、非空;一張表只能有一個;
唯一鍵約束:唯一,可以存在多個;
外鍵約束:參考性約束;
檢查性約束:check;
三層模型:
物理層 --> sa
邏輯層 --> dba
視圖層 --> coder
實現:
oracle, db2, sybase, infomix, sql server;
mysql, mariadb, postgresql, sqlite;
臟讀、不可重覆讀、幻讀
臟讀 :
臟讀就是指當一個事務正在訪問數據,並且對數據進行了修改,而這種修改還沒有提交到資料庫中,這時,另外一個事務也訪問這個數據,然後使用了這個數據。
不可重覆讀 :
是指在一個事務內,多次讀同一數據。
在這個事務還沒有結束時,另外一個事務也訪問該同一數據。
那麼,在第一個事務中的兩 次讀數據之間,由於第二個事務的修改,那麼第一個事務兩次讀到的的數據可能是不一樣的。
這樣就發生了在一個事務內兩次讀到的數據是不一樣的,因此稱為是不 可重覆讀。
例如,一個編輯人員兩次讀取同一文檔,但在兩次讀取之間,作者重寫了該文檔。當編輯人員第二次讀取文檔時,文檔已更改。原始讀取不可重覆。如果只有在作者全部完成編寫後編輯人員才可以讀取文檔,則可以避免該問題。
不可重覆讀的重點是修改 :
同樣的條件 , 你讀取過的數據 , 再次讀取出來發現值不一樣了
幻讀 :
是指當事務不是獨立執行時發生的一種現象。
例如,第一個事務對一個表中的數據進行了修改,這種修改涉及到表中的全部數據行。同時,第二個事務也修改這個表中的數據,這種修改是向表中插入一行新數據。那麼,以後就會發生操作第一個事務的用戶發現表中還有沒有修改的數據行,就好象發生了幻覺一樣。
例如,一個編輯人員更改作者提交的文檔,但當生產部門將其更改內容合併到該文檔的主複本時,發現作者已將未編輯的新材料添加到該文檔中。 如果在編輯人員和生產部門完成對原始文檔的處理之前,任何人都不能將新材料添加到文檔中,則可以避免該問題。
幻讀的重點在於新增或者刪除
同樣的條件 , 第 1 次和第 2 次讀出來的記錄數不一樣
Isolation 屬性一共支持五種事務設置,具體介紹如下:
DEFAULT 使用資料庫設置的隔離級別 ( 預設 ) ,由 DBA 預設的設置來決定隔離級別 .
READ_UNCOMMITTED 會出現臟讀、不可重覆讀、幻讀 ( 隔離級別最低,併發性能高 )
READ_COMMITTED 會出現不可重覆讀、幻讀問題(鎖定正在讀取的行)
REPEATABLE_READ 會出幻讀(鎖定所讀取的所有行)
SERIALIZABLE 保證所有的情況不會發生(鎖表)