SQL語句中的三個關鍵字:MINUS(減去),INTERSECT(交集)和UNION ALL(並集); 關於集合的概念,中學都應該學過,就不多說了.這三個關鍵字主要是對資料庫的查詢結果進行操作,正如其中文含義一樣:兩個查詢,MINUS是從第一個查詢結果減去第二個查詢結果,如果有相交部分就減去相交部分 ...
SQL語句中的三個關鍵字:MINUS(減去),INTERSECT(交集)和UNION ALL(並集);
關於集合的概念,中學都應該學過,就不多說了.這三個關鍵字主要是對資料庫的查詢結果進行操作,正如其中文含義一樣:兩個查詢,MINUS是從第一個查詢結果減去第二個查詢結果,如果有相交部分就減去相交部分;否則和第一個查詢結果沒有區別. INTERSECT是兩個查詢結果的交集,UNION ALL是兩個查詢的並集;
雖然同樣的功能可以用簡單SQL語句來實現,但是性能差別非常大,有人做過實驗:made_order共23萬筆記錄,charge_detail共17萬筆記錄:
SELECT order_id FROM made_order
MINUS
SELECT order_id FROM charge_detail
耗時:1.14 sec
SELECT a.order_id FROM made_order a
WHERE a.order_id NOT exists (
SELECT order_id
FROM charge_detail
WHERE order_id = a.order_id
)
耗時:18.19 sec
性能相差15.956倍!因此在遇到這種問題的時候,還是用MINUS,INTERSECT和UNION ALL來解決問題,否則面對業務中隨處可見的上百萬數據量的查詢,資料庫伺服器還不被咱玩的死翹翹?
PS:應用兩個集合的相減,相交和相加時,是有嚴格要求的:1.兩個集合的欄位必須明確(用*就不行,報錯);2.欄位類型和順序相同(名稱可以不同),如:集合1的欄位1是NUMBER,欄位2是VARCHAR,那麼集合2的欄位1必須也是NUMBER,欄位2必須是VARCHAR;3.不能排序,如果要對結果排序,可以在集合運算後,外面再套一個查詢,然後排序,如前面的例子可以改成:
SELECT * FROM
(SELECT order_id FROM made_order
MINUS
SELECT order_id FROM charge_detail)
ORDER BY ORDER_ID ASC