Mysql Join-連接查詢(上)

来源:https://www.cnblogs.com/chenjieyouge/archive/2019/11/03/11789332.html
-Advertisement-
Play Games

認識 多表連接查詢 ,我感覺應該是關係型資料庫最能體現其價值和靈活性的地方吧. 我覺得資料庫的作用, 歸納起來無非就是 存儲和查詢 . 一言蔽之,資料庫就是能靈活地存儲和查詢數據. 存儲上, 也是以文件的方式存的(Linux觀點, 一切皆文件), 文件就是存儲數據的載體, 資料庫文件跟其他的數據文件 ...


認識

多表連接查詢,我感覺應該是關係型資料庫最能體現其價值和靈活性的地方吧. 我覺得資料庫的作用, 歸納起來無非就是存儲和查詢.

一言蔽之,資料庫就是能靈活地存儲和查詢數據. 存儲上, 也是以文件的方式存的(Linux觀點, 一切皆文件), 文件就是存儲數據的載體, 資料庫文件跟其他的數據文件區別在於其是有規則的. 有約束和規範, 不像工作那樣,很多地方都在瞎搞,正是因為有事先約定, 因此資料庫檢索數據是非常快速的.

當然存儲方式上,我平時自己用的話就單機存即可, 公司的話一般都是分散式存儲的, 數據其實都是分佈在各台機器上的,什麼主從配置之類的. 我平時學慣用對於存儲倒不太關註,當然也會練習配置下主從.

顯然查詢時用的最多的, 我們部門到現在都沒有真正用上資料庫, 每個系統間的書都有些小問題,日常工作都是從各系統導出查詢集,讓後手工Excel進行Vlookup, 純人工做數便是打算離職的主要原因了. 畢竟vlookup+sumifs/contifs/pivote table 的工作效率上,是遠不及sql的select ,join, aggregation的. 但二者完成的工作卻是一樣的,只是效率的差別.

表連常用的有左(外)連接, 右(外)連接, 內連接, 笛卡爾積等. 平時用的vlookup 其實就是左連接. 表與表之間能進行連接,必然有進行連接的依據,即共同的欄位(key), 不然就是直接拼接,而非連接了.

  • inner join: 兩個表的"交集", 即左表與右表通過共同鍵的方式連接起來中, 共有的記錄
  • left join: 就是vlookup, 左表記錄全部顯示, 右表只顯示"匹配"上的記錄, 右表沒有匹配上左表的地方顯示為Null
  • right join: 跟left是一樣的,只不過是right視角

我這大半年的業務,都是vlookup 左連接, 基本不用inner join, 為啥, 業務的要求, 就是要以左表為做數的基礎, 不然不斷從其他表(右表)去匹配數據, 導致很難程式程式化.這裡仍然以前面 student, classes 表進行演示.

簡單連接查詢(inner, left, right)

-- 登錄mysql客戶端, 查看下使用的數據集
mysql> use student_db;
Database changed
mysql> show tables;
+----------------------+
| Tables_in_student_db |
+----------------------+
| classes              |
| clock_in             |
| students             |
+----------------------+
3 rows in set (0.04 sec)

mysql> select * from classes;
+----+------+
| id | name |
+----+------+
|  1 | 科學 |
|  2 | 藝術 |
+----+------+
2 rows in set (0.09 sec)

mysql> select * from students;
+----+----------+-----+--------+--------+----------+-----------+
| id | name     | age | height | gender | class_id | is_delete |
+----+----------+-----+--------+--------+----------+-----------+
|  1 | 愛因斯坦 |  18 | 180.00 | 男     |        1 | 0         |
|  2 | 居裡夫人 |  18 | 180.00 | 女     |        2 | 1         |
|  3 | 小王子   |  14 | 185.00 | 男     |        1 | 0         |
|  4 | 李銀河   |  59 | 175.00 | 男     |        2 | 1         |
|  5 | 黃蓉     |  38 | 160.00 | 女     |        1 | 0         |
|  6 | 冰心     |  28 | 150.00 | 女     |        2 | 1         |
|  7 | 王祖賢   |  18 | 172.00 | 女     |        1 | 1         |
|  8 | 周傑倫   |  36 | NULL   | 男     |        1 | 0         |
|  9 | 王小波   |  57 | 181.00 | 男     |        2 | 0         |
| 10 | 林徽因   |  25 | 166.00 | 女     |        2 | 0         |
| 11 | 小星     |  33 | 162.00 | 未填寫 |        3 | 1         |
| 12 | 張愛玲   |  12 | 180.00 | 女     |        4 | 0         |
| 13 | 馮唐     |  12 | 170.00 | 男     |        4 | 0         |
| 14 | 胡適     |  34 | 176.00 | 男     |        5 | 0         |
+----+----------+-----+--------+--------+----------+-----------+
14 rows in set (0.25 sec)

如果沒有測試數據, 就是自己create database / table, 然後 create table .. 然後 insert into tb_name values (), (),...了呀.

關聯依據: students 表的 class_id 和 classes 表的 id 表示的是同一個東西(班級id)

補充個寫sql的技巧(大致模擬電腦的運行順序來)

  • 先寫from tb_name1 as a, tb_name2 as b (取別名)
  • 然後再 連接條件 join on ....(用上別名)
  • 然後再寫where......
  • 最後再寫select....

select 最後寫, 進行分塊查詢, 再拼接(join, union...), 腦海裡時刻有表的形象.

-- 檢索出學生和班級能對應上的信息
select s.*, c.*
from students s, classes c  -- as可省略
where s.class_id = c.id;

-- 這種預設的where等值連接, 其實就跟 inner join 是一樣的
-- out
+----+----------+-----+--------+--------+----------+-----------+----+------+
| id | name     | age | height | gender | class_id | is_delete | id | name |
+----+----------+-----+--------+--------+----------+-----------+----+------+
|  1 | 愛因斯坦 |  18 | 180.00 | 男     |        1 | 0         |  1 | 科學 |
|  2 | 居裡夫人 |  18 | 180.00 | 女     |        2 | 1         |  2 | 藝術 |
|  3 | 小王子   |  14 | 185.00 | 男     |        1 | 0         |  1 | 科學 |
|  4 | 李銀河   |  59 | 175.00 | 男     |        2 | 1         |  2 | 藝術 |
|  5 | 黃蓉     |  38 | 160.00 | 女     |        1 | 0         |  1 | 科學 |
|  6 | 冰心     |  28 | 150.00 | 女     |        2 | 1         |  2 | 藝術 |
|  7 | 王祖賢   |  18 | 172.00 | 女     |        1 | 1         |  1 | 科學 |
|  8 | 周傑倫   |  36 | NULL   | 男     |        1 | 0         |  1 | 科學 |
|  9 | 王小波   |  57 | 181.00 | 男     |        2 | 0         |  2 | 藝術 |
| 10 | 林徽因   |  25 | 166.00 | 女     |        2 | 0         |  2 | 藝術 |
+----+----------+-----+--------+--------+----------+-----------+----+------+

-- inner join on 
select s.*, c.*
from students s
inner join classes c
on s.class_id = c.id;

-- out
+----+----------+-----+--------+--------+----------+-----------+----+------+
| id | name     | age | height | gender | class_id | is_delete | id | name |
+----+----------+-----+--------+--------+----------+-----------+----+------+
|  1 | 愛因斯坦 |  18 | 180.00 | 男     |        1 | 0         |  1 | 科學 |
|  2 | 居裡夫人 |  18 | 180.00 | 女     |        2 | 1         |  2 | 藝術 |
|  3 | 小王子   |  14 | 185.00 | 男     |        1 | 0         |  1 | 科學 |
|  4 | 李銀河   |  59 | 175.00 | 男     |        2 | 1         |  2 | 藝術 |
|  5 | 黃蓉     |  38 | 160.00 | 女     |        1 | 0         |  1 | 科學 |
|  6 | 冰心     |  28 | 150.00 | 女     |        2 | 1         |  2 | 藝術 |
|  7 | 王祖賢   |  18 | 172.00 | 女     |        1 | 1         |  1 | 科學 |
|  8 | 周傑倫   |  36 | NULL   | 男     |        1 | 0         |  1 | 科學 |
|  9 | 王小波   |  57 | 181.00 | 男     |        2 | 0         |  2 | 藝術 |
| 10 | 林徽因   |  25 | 166.00 | 女     |        2 | 0         |  2 | 藝術 |
+----+----------+-----+--------+--------+----------+-----------+----+------+

給表, 欄位取別名 as

-- 查詢前3個藝術班女生的姓名和班級
select s.name as "姓名", c.name as "班級"
from students s
inner join classes c
on s.class_id = c.id
where (s.gender = "女") and (c.name = "藝術")
limit 3;

-- out
+----------+------+
| 姓名     | 班級 |
+----------+------+
| 居裡夫人 | 藝術 |
| 冰心     | 藝術 |
| 林徽因   | 藝術 |
+----------+------+
3 rows in set (0.15 sec)

不難發現, 其實sql還是很簡單的, 只要你的邏輯是清晰的, 一點一點地查詢出來. 其實無非也就兩種形式, 多表連接+where+... 或者配合子查詢然後再進行union, 套路都是一樣的.

-- 查詢能對應上班級的學生和班級信息, 並按照班級名稱降序
select * 
from students s, classes c
where s.class_id = c.id
order by c.name desc
limit 3;

-- out
+----+--------+-----+--------+--------+----------+-----------+----+------+
| id | name   | age | height | gender | class_id | is_delete | id | name |
+----+--------+-----+--------+--------+----------+-----------+----+------+
|  4 | 李銀河 |  59 | 175.00 | 男     |        2 | 1         |  2 | 藝術 |
|  6 | 冰心   |  28 | 150.00 | 女     |        2 | 1         |  2 | 藝術 |
| 10 | 林徽因 |  25 | 166.00 | 女     |        2 | 0         |  2 | 藝術 |
+----+--------+-----+--------+--------+----------+-----------+----+------+
3 rows in set (0.07 sec)

-- 先按班級名降序, 如果班級名相同, 則按身高降序, 再則按學生id升序
select s.name, s.height, c.name
from students s, classes c
where s.class_id = c.id
order by c.name desc, s.height desc, s.id asc
limit 6;

-- out
+----------+--------+------+
| name     | height | name |
+----------+--------+------+
| 王小波   | 181.00 | 藝術 |
| 居裡夫人 | 180.00 | 藝術 |
| 李銀河   | 175.00 | 藝術 |
| 林徽因   | 166.00 | 藝術 |
| 冰心     | 150.00 | 藝術 |
| 小王子   | 185.00 | 科學 |
+----------+--------+------+
6 rows in set (0.09 sec)

left join 我在工作中每天都在用, 功能跟Excel的vlookup一樣的, 都以左表為基礎進行匹配, 沒匹配上則顯示為Null

-- 從classes表中, 匹配出student的姓名和班級
select s.name as "姓名", c.name as "班級"
from students s 
left join classes c
on s.class_id = c.id;

-- out
+----------+------+
| 姓名     | 班級 |
+----------+------+
| 愛因斯坦 | 科學 |
| 小王子   | 科學 |
| 黃蓉     | 科學 |
| 王祖賢   | 科學 |
| 周傑倫   | 科學 |
| 居裡夫人 | 藝術 |
| 李銀河   | 藝術 |
| 冰心     | 藝術 |
| 王小波   | 藝術 |
| 林徽因   | 藝術 |
| 小星     | NULL |
| 張愛玲   | NULL |
| 馮唐     | NULL |
| 胡適     | NULL |
+----------+------+
14 rows in set (0.18 sec)

-- 查詢出沒有對應班級的學生姓名
select s.name, c.name
from students s
left join classes c
on s.class_id = c.id
having c.name is null;

+--------+------+
| name   | name |
+--------+------+
| 小星   | NULL |
| 張愛玲 | NULL |
| 馮唐   | NULL |
| 胡適   | NULL |
+--------+------+
4 rows in set (0.05 sec)

-- 過濾條件用where也是可以的
select s.name, c.name 
from students s 
left join classes c 
on s.class_id = c.id
where c.name is null;

where 與 having的區別

  • where 是在分組前對數據進行過濾, where 後邊不能用聚合函數
  • hvaing 是在分組後對數據進行過濾, having 後面可以用聚合函數
  • 查詢中的執行順序: from > where > group by 及 聚合函數 > having > order > select

  • having 即用來彌補where在group by 時的不足, 因為where > 聚合函數

子查詢

所謂子查詢,無法就是select 嵌套呀, 這個只要有學過一點編程的小伙伴都立馬能get, 就算不會編程, 我看我同事用Excel的公式嵌套也很厲害的, 外層一個sumifs, 裡面一個vlookup.... 反正原理都一樣的.

  • 標量子查詢: 查詢的結果是一個值
  • 列子查詢: 返回的結果是一個列
  • 行子查詢: 返回的結果是一個行
-- 標量: 查詢出高於平均身高的學生姓名, 身高, 所在班級

-- step 1: 先查出身高均值(標量)
select avg(height) from students;
+-------------+
| avg(height) |
+-------------+
| 172.076923  |
+-------------+
1 row in set (0.07 sec)

-- step2: 嵌套進來呀
select s.name, s.height, c.name
from students s
left join classes c
on class_id = c.id
where s.height > (select avg(height) from students);

+----------+--------+------+
| name     | height | name |
+----------+--------+------+
| 愛因斯坦 | 180.00 | 科學 |
| 小王子   | 185.00 | 科學 |
| 居裡夫人 | 180.00 | 藝術 |
| 李銀河   | 175.00 | 藝術 |
| 王小波   | 181.00 | 藝術 |
| 張愛玲   | 180.00 | NULL |
| 胡適     | 176.00 | NULL |
+----------+--------+------+
7 rows in set (0.11 sec)

列子查詢: 即一查多, 關鍵字: in

-- 查詢出, 根據班級id, 所對應的學生名字

-- 分析,一個班級ID -> 多個名字, 是一查多(列子查詢)
select s.name
from students s
where s.class_id in (select id from classes)

-- out
| name    |
+----------+
| 愛因斯坦 |
| 居裡夫人 |
| 小王子   |
| 李銀河   |
| 黃蓉     |
| 冰心     |
| 王祖賢   |
| 周傑倫   |
| 王小波   |
| 林徽因   |
+----------+

行級子查詢 (將多個欄位合成一個行元素)

-- 查詢出 年齡最大, 且身高最高的的學生信息
select * 
from students s
where (s.age, s.height) = (select max(age), max(height) from students);

-- out: 可能不存在這樣牛逼的記錄
Empty set

小結

  • 資料庫最核心的兩個功能在於存儲和檢索數據

  • 查詢高效的原因在於,數據文件的組織,存儲方式等是有規則約定的.
  • 執行順序是from > where > group by 及 聚合函數 > having > order > select

  • 常用的表連接有inner join, left join, right join ... 我平時用最多的left join 因為Excel的vlookup 原因
  • 子查詢其實就是sql的嵌套, 根據返回的結果有標量, 列, 行的形式

接下的講講自連接, 多表聯合查詢進階, 即子查詢配合表連接, where, union這些....


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在使用 Python 開發的過程中,工程一多,難免會碰到不同的工程依賴不同版本的庫的問題; 亦或者是在開發過程中不想讓物理環境里充斥各種各樣的庫,引發未來的依賴災難。 此時,我們需要對於不同的工程使用不同的虛擬環境來保持開發環境以及宿主環境的清潔。 這裡,就要隆重介紹 virtualenv,一個可以 ...
  • 1.exit 功能描述:退出Shell 命令語法:exit [選項] 2.sulogin 功能描述:可以進行單用戶登錄,在啟動時Shell將不會讀取/etc/profile或$HOME/.profile文件 命令語法:sulogin [選項] [TTY] 選項含義: -p:單用戶Shell調用一個破 ...
  • 步進電機 伺服電機 精度 1.8 0.9(2相) 編碼器 過載能力 無 3倍 開閉環 開環 閉環 價格 便宜 貴 控制模式 速度(頻率) 位置(脈衝數) 扭矩(電流) 低頻特性 震動 穩定 轉速 200-500 3000 ...
  • 1.什麼是Nginx? Nginx是一個高性能的HTTP和反向代理伺服器,常用於做負載均衡伺服器 2.為什麼要用Nginx?跨平臺、配置簡單非阻塞、高併發連接:處理2-3萬併發連接數,官方監測能支持5萬併發記憶體消耗小:開啟10個nginx才占150M記憶體,Nginx採取了分階段資源分配技術nginx ...
  • 1.在PostgreSQL安裝目錄下data文件夾,打開pg_hba.conf文件,新增允許訪問的ip 2.打開postgresql.conf,將listen_addresses = 'localhost' 改成 listen_addresses = '*'(改過請忽略) 3.重啟服務 ...
  • "點我查看秘籍連載" 頁翻譯:快速地址轉換 雖然操作系統通過頁表也能將虛擬頁翻譯成記憶體中對應的頁幀,但是它仍然很慢。另一方面,如果訪問每個頁都需要操作系統來參與幫忙翻譯,這會頻繁陷入內核,效率是非常低的。所以,這裡再次將任務交給硬體CPU去做。 提示:操作系統將底層任務交給硬體提高效率 前文介紹段的 ...
  • 下麵是我錄製的視頻課程列表,歡迎大家關註。如果大家需要購買,可評論或私信找我拿優惠券噢。 1. "Shell精品進階教程:理解Shell的方方面面" 2. "正則表達式入門教程" ...
  • 現如今的互聯網世界里,代理服務已經十分常見,它通常作為一個第三方或者說中轉站角色替代用戶取得信息或者服務。 根據代理對象的不同,代理服務可以分為正向代理和反向代理。 ...
一周排行
    -Advertisement-
    Play Games
  • C#TMS系統代碼-基礎頁面BaseCity學習 本人純新手,剛進公司跟領導報道,我說我是java全棧,他問我會不會C#,我說大學學過,他說這個TMS系統就給你來管了。外包已經把代碼給我了,這幾天先把增刪改查的代碼背一下,說不定後面就要趕鴨子上架了 Service頁面 //using => impo ...
  • 委托與事件 委托 委托的定義 委托是C#中的一種類型,用於存儲對方法的引用。它允許將方法作為參數傳遞給其他方法,實現回調、事件處理和動態調用等功能。通俗來講,就是委托包含方法的記憶體地址,方法匹配與委托相同的簽名,因此通過使用正確的參數類型來調用方法。 委托的特性 引用方法:委托允許存儲對方法的引用, ...
  • 前言 這幾天閑來沒事看看ABP vNext的文檔和源碼,關於關於依賴註入(屬性註入)這塊兒產生了興趣。 我們都知道。Volo.ABP 依賴註入容器使用了第三方組件Autofac實現的。有三種註入方式,構造函數註入和方法註入和屬性註入。 ABP的屬性註入原則參考如下: 這時候我就開始疑惑了,因為我知道 ...
  • C#TMS系統代碼-業務頁面ShippingNotice學習 學一個業務頁面,ok,領導開完會就被裁掉了,很突然啊,他收拾東西的時候我還以為他要旅游提前請假了,還在尋思為什麼回家連自己買的幾箱飲料都要叫跑腿帶走,怕被偷嗎?還好我在他開會之前拿了兩瓶芬達 感覺感覺前面的BaseCity差不太多,這邊的 ...
  • 概述:在C#中,通過`Expression`類、`AndAlso`和`OrElse`方法可組合兩個`Expression<Func<T, bool>>`,實現多條件動態查詢。通過創建表達式樹,可輕鬆構建複雜的查詢條件。 在C#中,可以使用AndAlso和OrElse方法組合兩個Expression< ...
  • 閑來無聊在我的Biwen.QuickApi中實現一下極簡的事件匯流排,其實代碼還是蠻簡單的,對於初學者可能有些幫助 就貼出來,有什麼不足的地方也歡迎板磚交流~ 首先定義一個事件約定的空介面 public interface IEvent{} 然後定義事件訂閱者介面 public interface I ...
  • 1. 案例 成某三甲醫預約系統, 該項目在2024年初進行上線測試,在正常運行了兩天後,業務系統報錯:The connection pool has been exhausted, either raise MaxPoolSize (currently 800) or Timeout (curren ...
  • 背景 我們有些工具在 Web 版中已經有了很好的實踐,而在 WPF 中重新開發也是一種費時費力的操作,那麼直接集成則是最省事省力的方法了。 思路解釋 為什麼要使用 WPF?莫問為什麼,老 C# 開發的堅持,另外因為 Windows 上已經裝了 Webview2/edge 整體打包比 electron ...
  • EDP是一套集組織架構,許可權框架【功能許可權,操作許可權,數據訪問許可權,WebApi許可權】,自動化日誌,動態Interface,WebApi管理等基礎功能於一體的,基於.net的企業應用開發框架。通過友好的編碼方式實現數據行、列許可權的管控。 ...
  • .Net8.0 Blazor Hybird 桌面端 (WPF/Winform) 實測可以完整運行在 win7sp1/win10/win11. 如果用其他工具打包,還可以運行在mac/linux下, 傳送門BlazorHybrid 發佈為無依賴包方式 安裝 WebView2Runtime 1.57 M ...