首先根據 "準備工作" 中的操作導入大學模式,打開資料庫連接後進入到 MySQL 的交互界面,再使用命令 切換到 db book 資料庫。 單關係查詢 SQL 查詢的基本結構由三個子句構成, ,`from where from where select` 子句指定的運算,然後產生一個關係作為結果,即 ...
首先根據準備工作中的操作導入大學模式,打開資料庫連接後進入到 MySQL 的交互界面,再使用命令 use db-book;
切換到 db-book 資料庫。
單關係查詢
SQL 查詢的基本結構由三個子句構成,select
,from
和 where
,查詢的輸入是 from
子句中列出的關係,在這些關係上進行 where
和 select
子句指定的運算,然後產生一個關係作為結果,即 SQL 查詢的結果是一個關係,這點很重要。
先考慮一個簡單的查詢,找出所有教師的名字,教師的名字可以在 instructor 關係中找到,這樣我們 from instructor
來查詢;教師的名字出現在 name 屬性中,這樣我們使用 select name
子句,綜合起來就是下麵的查詢。
mysql> select name
-> from instructor;
+------------+
| name |
+------------+
| Srinivasan |
| Wu |
| Mozart |
| Einstein |
| El Said |
| Gold |
| Katz |
| Califieri |
| Singh |
| Crick |
| Brandt |
| Kim |
+------------+
12 rows in set (0.01 sec)
現在考慮另一個查詢,找出所有教師所在的系名。
mysql> select dept_name
-> from instructor;
+------------+
| dept_name |
+------------+
| Biology |
| Comp. Sci. |
| Comp. Sci. |
| Comp. Sci. |
| Elec. Eng. |
| Finance |
| Finance |
| History |
| History |
| Music |
| Physics |
| Physics |
+------------+
12 rows in set (0.00 sec)
註意到 Comp. Sci.
等行出現了不止一次,這是因為一個系可能有多個教師。
在關係模型的形式化數學定義中,關係是一個集合,因此關係中不包含重覆的元素。但在實踐中,有時我們希望保留重覆,更關鍵的事,去掉重覆是消耗較大的,因此 SQL 預設在關係以及 SQL 表達式結果中允許出現重覆。
如果我們想要去掉重覆,可以在 select
後加入關鍵字 distinct
,也就是像下麵這樣。
mysql> select distinct dept_name
-> from instructor;
+------------+
| dept_name |
+------------+
| Biology |
| Comp. Sci. |
| Elec. Eng. |
| Finance |
| History |
| Music |
| Physics |
+------------+
7 rows in set (0.01 sec)
完整地說,SQL 支持使用關鍵字 all
來顯式指明不去掉重覆,但因為標準預設的行為即保留重覆元組,因此不使用 all
才是更符合習慣的寫法。
select
子句還可帶含有四則運算運算符的表達式,運算對象可以是常數或元組的屬性,這一點對應關係代數運算中的廣義投影,看下麵的查詢。
mysql> select ID, name, dept_name, salary * 1.1
-> from instructor;
+-------+------------+------------+--------------+
| ID | name | dept_name | salary * 1.1 |
+-------+------------+------------+--------------+
| 10101 | Srinivasan | Comp. Sci. | 71500.000 |
| 12121 | Wu | Finance | 99000.000 |
| 15151 | Mozart | Music | 44000.000 |
| 22222 | Einstein | Physics | 104500.000 |
| 32343 | El Said | History | 66000.000 |
| 33456 | Gold | Physics | 95700.000 |
| 45565 | Katz | Comp. Sci. | 82500.000 |
| 58583 | Califieri | History | 68200.000 |
| 76543 | Singh | Finance | 88000.000 |
| 76766 | Crick | Biology | 79200.000 |
| 83821 | Brandt | Comp. Sci. | 101200.000 |
| 98345 | Kim | Elec. Eng. | 88000.000 |
+-------+------------+------------+--------------+
12 rows in set (0.00 sec)
這個查詢,如上所示,返回一個與 instructor 一樣的關係,除了屬性 salary 的值是原來的 1.1 倍,查詢的語義是為每位教師增長 10% 的工資的結果,註意這並不修改 instructor 關係,而是返回了一個新的關係。
where
子句允許我們只選出那些在 from
子句的結果關係中滿足特定謂詞的元組。
考慮查詢,找出所有在 Computer Science 系並且工資超過 70000 美元的教師的姓名。我們可以使用 where
子句寫出下麵的查詢。
mysql> select name
-> from instructor
-> where dept_name = 'Comp. Sci.' and salary > 70000;
+--------+
| name |
+--------+
| Katz |
| Brandt |
+--------+
2 rows in set (0.01 sec)
SQL 允許在 where
子句中使用邏輯連詞 and
,or
和 not
,邏輯連詞的運算對象可以是包含比較運算符的表達式。註意相等用 =
表示,不相等用 <>
表示。
多關係查詢
上面的查詢都是基於單個關係的,但是通常我們的查詢需要從多個關係中獲取信息。
考慮查詢,找出所有教師的姓名,以及他們所在的系的名稱和系所在的建築物的名稱。考慮 instructor 關係的模式,我們可以從 dept_name 屬性得到系名,但是系所在的建築物的名稱記錄在 department 關係的 building 屬性中,為了回答查詢,instructor 關係中的每個元組必須與 department 關係中的元組匹配,後者在 dept_name 上的取值等於 instructor 元組在 dept_name 上的取值。有了這樣的思路,我們可以嘗試寫對應的 SQL 查詢。
mysql> select name, instructor.dept_name, building
-> from instructor, department
-> where instructor.dept_name = department.dept_name;
+------------+------------+----------+
| name | dept_name | building |
+------------+------------+----------+
| Crick | Biology | Watson |
| Srinivasan | Comp. Sci. | Taylor |
| Katz | Comp. Sci. | Taylor |
| Brandt | Comp. Sci. | Taylor |
| Kim | Elec. Eng. | Taylor |
| Wu | Finance | Painter |
| Singh | Finance | Painter |
| El Said | History | Painter |
| Califieri | History | Painter |
| Mozart | Music | Packard |
| Einstein | Physics | Watson |
| Gold | Physics | Watson |
+------------+------------+----------+
12 rows in set (0.00 sec)
註意 dept_name 屬性既出現在 instructor 關係中,也出現在 department 關係中,關係名作為首碼可以說明我們指的是哪一個屬性,與之相反,name 屬性和 building 屬性只出現在一個關係中,因而不需要把關係名作為首碼。這種命名慣例的使用,要求出現在 from
子句中的關係具有可區分的名字,在某些情況下這樣的要求達不到,例如當需要組合來自同一個關係的兩個不同元組的信息的時候,對於這種情況,在後面我們會提到可以用更名(rename)運算來處理。
再考慮一個查詢,找出 Computer Science 系的教師名字和教授的課程標識
mysql> select name, course_id
-> from instructor, teaches
-> where instructor.ID = teaches.ID and dept_name = 'Comp. Sci.';
+------------+-----------+
| name | course_id |
+------------+-----------+
| Srinivasan | CS-101 |
| Srinivasan | CS-315 |
| Srinivasan | CS-347 |
| Katz | CS-101 |
| Katz | CS-319 |
| Brandt | CS-190 |
| Brandt | CS-190 |
| Brandt | CS-319 |
+------------+-----------+
8 rows in set (0.00 sec)
這裡 dept_name 只出現在 instructor 關係中,因此不必要寫 instructor.dept_name。
通常說來,一個 SQL 查詢的含義可以這麼理解:
- 按照
from
子句中列出的關係產生笛卡爾積 - 在步驟 1 的結果上應用
where
子句指定的謂詞篩選 - 在步驟 2 的結果上輸出
select
子句指定的屬性或表達式的結果
註意這是邏輯上的執行方式,實際執行會有較多的優化方式,例如儘可能地不產生一個龐大的笛卡爾積,而是只產生滿足 where
子句的笛卡爾積元素。