集合操作常用的集合操作主要有三種:UNION(聯合集)、INTERSECT(交叉集)、EXCEPT(求差集)。以上三種集合的操作都是直接作用在兩個或者多個 SQL 查詢語句之間,將所有的元組按照特定的要求篩選後拼接起來。SQL 查詢後實際上是得到一個新的數據表的形式,因此所作用的數據表之間必須定義相 ...
集合操作
常用的集合操作主要有三種:UNION(聯合集)、INTERSECT(交叉集)、EXCEPT(求差集)。以上三種集合的操作都是直接作用在兩個或者多個 SQL 查詢語句之間,將所有的元組按照特定的要求篩選後拼接起來。SQL 查詢後實際上是得到一個新的數據表的形式,因此所作用的數據表之間必須定義相同的屬性,且屬性定義的順序相同。
舉個例子,要獲取所有擁有 gmail 或者 hotmail 郵箱賬號的學生信息:
(SELECT * FROM Student WHERE Email like '%@gmail.com') UNION (SELECT * FROM Student WHERE Email like '%@hotmail.com');
但以下語句無法正常工作,因為所作用的兩個表的屬性不同:
(SELECT StudentID, Name FROM Student) UNION (SELECT Email FROM Student);
連接操作 JOIN
當我們想要查詢得到的數據包含多個表的內容,也就是要同時獲得不同表中屬性數值的時候,常使用 JOIN 語句
內連接(INNER JOIN)
內連接是應用程式中用的普遍的"連接"操作,它一般都是預設連接類型。內連接基於連接謂詞將兩張表(如 A 和 B)的列組合在一起,產生新的結果表。查詢會將 A 表的每一行和 B 表的每一行進行比較,並找出滿足連接謂詞的組合。當連接謂詞被滿足,A 和 B 中匹配的行會按列組合(併排組合)成結果集中的一行。
內連接可以進一步被分為:相等連接、自然連接、交叉連接
交叉連接 (CROSS JOIN)
交叉連接,又稱為笛卡爾連接(Cartesian join)或者叉乘(Product),它是所有類型內連接的基礎 。把表視為行記錄的集合,交叉連接返回這兩個集合的笛卡爾積。等價於連接條件永遠為“真”。
如果 A 和 B 是兩個集合,那麼它們的交叉連接就記為:A x B。比如:
SELECT * FROM employee CROSS JOIN department; -- 隱式表達交叉連接 SELECT * FROM employee, department;
相等連接(equi-join,或 equijoin)
相等連接是比較連接的一種特例,它的連接謂詞只用了相等比較。通常在 JOIN 語句後跟 ON 關鍵字補充相等比較語句。舉個例子,找出所有至少存在一名學生註冊的課程名字:
SELECT DISTINCT c.Cname FROM Course c INNER JOIN Enrol e ON c.No=e.CourseNo;
自然連接(NATURAL JOIN)
自然連接比相等連接的進一步特例化。兩表做自然連接時,兩表中的所有名稱相同的列都將被比較,這是隱式的。自然連接得到的結果表中,兩表中名稱相同的列只出現一次。也就是說,通過相等連接得到的結果表中,用於比較的列可能會重覆,而在自然連接中並不會出現。
SELECT * FROM Student s NATURAL JOIN Enrol1 e;
外連接(OUTER JOIN)
外連接與內連接最大的區別在於,外連接並不要求連接的兩表的每一條記錄在對方表中都一條匹配的記錄。要保留所有記錄(甚至這條記錄沒有匹配的記錄也要保留)的表稱為保留表,沒有匹配的部分用 NULL 代替。
外連接可依據連接表保留左表,右表或全部表的行而進一步分為左外連接,右外連接和全連接。
需要註意一點,當外部連接既包含 ON 子句又包含 WHERE 子句時,應當只把表之間的連接條件寫在 ON 子句中,對錶中數據的篩選必須寫在 WHERE 子句中。而內部連接的各條件表達式既可以放在 ON 子句又可以放在 WHERE 子句中。這是因為對於外部連接,保留表中被 ON 子句篩除掉的行要被添加回來,在此操作之後才會用 WHERE 子句去篩選連接結果中的各行。
左外連接(LEFT OUTER JOIN)
左外連接(left outer join),亦簡稱為左連接(left join),若 A 和 B 兩表進行左外連接,那麼結果表中將包含"左表"(即表 A)的所有記錄,即使那些記錄在"右表" B 沒有符合連接條件的匹配。這意味著即使 ON 語句在 B 中的匹配項是0條,連接操作還是會返回一條記錄,只不過這條記錄中來自於 B 的每一列的值都為 NULL。這意味著左外連接會返回左表的所有記錄和右表中匹配記錄的組合(如果右表中無匹配記錄,來自於右表的所有列的值設為 NULL)。如果左表的一行在右表中存在多個匹配行,那麼左表的行會複製和右表匹配行一樣的數量,併進行組合生成連接結果。
SELECT * FROM Student s LEFT JOIN Enrol1 e ON s.StudentID=e.StudentID;
右外連接(RIGHT OUTER JOIN)
右外連接(right outer join),亦簡稱右連接(right join),它與左外連接完全類似,只不過是作連接的表的順序相反而已。如果 A 表右連接 B 表,那麼"右表" B 中的每一行在連接表中至少會出現一次。如果 B 表的記錄在"左表" A 中未找到匹配行,連接表中來源於 A 的列的值設為 NULL。
右連接操作返回右表的所有行和這些行在左表中匹配的行(沒有匹配的,來源於左表的列值設為 NULL)。
SELECT * FROM Student s RIGHT JOIN Enrol1 e ON s.StudentID=e.StudentID;
子查詢 Subqueries
子查詢通常用在 FROM 子句或者 WHERE 子句當中。用於 FROM 子句的目的通常是從查詢的到結果表中採取進一步的查詢,比如調用內置函數,獲取最大值、最小值、平均值、計數等等。用於 WHERE 子句的情況,通常會使用一下關鍵字:
- IN:檢查某個元組是否存在於子查詢結果中。
- EXISTS:檢查子查詢結果是否為空。
- ALL, SOME or ANY: 使用子查詢結果前對該結果進行相應的比較。
- NOT:上述關鍵字前使用 NOT 是結果取反。
列出最少有10名學生參加的課程的所有學生信息以及該課程的名字:
SELECT s.*, e1.CourseNo FROM Student s NATURAL JOIN Enrol e1 WHERE e1.CourseNo IN (SELECT e2.CourseNo FROM Enrol e2 GROUP BY e2.CourseNo HAVING COUNT(*) < 10);
列出所有至少參加一門課程的學生信息:
SELECT s.* FROM Student s WHERE EXISTS (SELECT * FROM Enrol e WHERE s.StudentID=e.StudentID);
列出所有沒有參加任何課程的學生信息:
SELECT s.* FROM Student s WHERE NOT EXISTS (SELECT * FROM Enrol e WHERE s.StudentID=e.StudentID);
列出在2016學年第二學期中,報名學生人數最多的課程:
SELECT e.CourseNo FROM (SELECT e1.CourseNo, COUNT(*) AS NoOfStudents FROM Enrol e1 WHERE e1.Semester = '2016 S2' GROUP BY e1.CourseNo) e WHERE e.NoOfStudents = (SELECT MAX(e2.NoOfStudents) FROM (SELECT e1.CourseNo, COUNT(*) AS NoOfStudents FROM Enrol e1 WHERE e1.Semester = '2016 S2' GROUP BY e1.CourseNo) e2);
列出在2016學年第二學期中,報名學生人數比至少一個其他課程要多的課程:
SELECT e.CourseNo FROM (SELECT e1.CourseNo, COUNT(*) AS NoOfStudents FROM Enrol e1 WHERE e1.Semester = '2016 S2' GROUP BY e1.CourseNo) e WHERE e.NoOfStudents > ANY (SELECT e2.NoOfStudents FROM (SELECT e1.CourseNo, COUNT(*) AS NoOfStudents FROM Enrol e1 WHERE e1.Semester = '2016 S2' GROUP BY e1.CourseNo) e2);
具體創建資料庫的代碼可以通過下麵的鏈接得到:
https://github.com/OddUlrich/Experiment-Code/tree/master/SQL%20Select%20Practice
若想做更多關於查詢的練習,可以訪問下麵的這個網站:
https://pgexercises.com/
參考資料:
連接 (join):https://zh.wikipedia.org/wiki/%E8%BF%9E%E6%8E%A5