SQL優化--inner、left join替換in、not in、except

来源:https://www.cnblogs.com/zhangdk/archive/2019/04/22/notintoleftjoin.html
-Advertisement-
Play Games

在in\not in\except這種查詢結構時,如果涉及到的數據量較大,建議堅決用連接left join/inner join等替換掉,否則查詢效率十分低下。 ...


新系統上線,用戶基數16萬,各種查詢timeout。打開砂鍋問到底,直接看sql語句吧,都是淚呀,一大堆in\not in\except。這裡總結一下,怎麼替換掉in\not in\except。

1. in/except->left join

查詢目的

根據

  • 客戶表(Customer,按照站點、冊本劃分,16萬數據)
  • 水錶表(Meter,16萬數據)
  • 水錶抄表數據表(Meter_Data,遠傳表每天更新,27萬數據)

關聯查詢,查詢某天某個冊本下水錶未上傳抄表數據的用戶。

原查詢結構

select * 
from Customer cs
where 
cs.Group_No = '冊本編號' and
cs.Customer_No in 
(
    select Customer_No 
    from  Customer cs
    left join Meter me on cs.Customer_No = me.Customer_No
    where cs.Group_No = '冊本編號'
    except
    select Customer_No
    from Customer cs
    left join Meter me on cs.Customer_No = me.Customer_No
    inner join Meter_data md on me.meter_no = md.meter_no and md.date = '2019-04-09'
    where cs.Group_NO='冊本編號'
)

原查詢思路

  1. 查詢出目標冊本已上傳數據的用戶編號
select Customer_No
from Customer cs
left join Meter me on cs.Customer_No = me.Customer_No
inner join Meter_data md on me.meter_no = md.meter_no and md.date = '2019-04-09'
where cs.Group_NO='冊本編號'
  1. 查詢出目標冊本全部用戶編號
select Customer_No 
from  Customer cs
left join Meter me on cs.Customer_No = me.Customer_No
where cs.Group_No = '冊本編號'
  1. 全部用戶編號中排除已上傳數據的用戶編號,即為未上傳數據的用戶編號
全部用戶編號 except 已抄表的用戶編號
  1. 查詢出在未抄表用戶編號集合中的用戶信息。
select * 
from Customer cs
where 
cs.Group_No = '冊本編號' and
cs.Customer_No in 
(全部用戶編號 except 已抄表的用戶編號)

思路倒是沒有問題,但是in+except查詢效率不要太慢了,本來想測試個時間,結果執行了幾分鐘愣是沒出結果,直接終止掉了

優化查詢結構

其實in\not in\except這些語法在查詢中使用,效率不高是公認的事實,但是可能是由於語義比較明顯吧,很多人還是喜歡這樣用。我們這裡使用left join來替代in+except。這裡就來改掉上面的查詢:

select cs.*
from Customer cs
left join Meter me on cs.Customer_No = me.Customer_No
left join Meter_data md on me.meter_no = md.meter_no and md.date = '2019-04-09'
where cs.Group_NO='冊本編號' and md.meter_no is null;

優化查詢思路

  1. 用left join代替in+except,通過left join獲取目標冊本下全部用戶的信息,並與當天上傳的抄表數據進行連接;
  2. 連接中,右表為空即抄表數據為空的,即為當前未上傳數據的客戶信息;

left join on expression where expression 執行時,首先確保左表數據全部返回,然後應用on後指定的條件。因此,on的條件如果是對左表數據的過濾,是無效的;對右表數據的過濾是有效的。對左表數據的過濾條件,需要放到where條件中。

2. not in->left join

上面in+except的寫法,可以使用not in簡化一下,但是一樣效率不高。這裡想要說明的是not in也可以很方便的使用left join替換。

not in結構

select * 
from Customer cs
where 
cs.Group_No = '冊本編號' and
cs.Customer_No not in 
(
    select Customer_No
    from Customer cs
    left join Meter me on cs.Customer_No = me.Customer_No
    inner join Meter_data md on me.meter_no = md.meter_no and md.date = '2019-04-09'
    where cs.Group_NO='冊本編號'
)

left join結構

select cs.*
from Customer cs
left join Meter me on cs.Customer_No = me.Customer_No
left join Meter_data md on me.meter_no = md.meter_no and md.date = '2019-04-09'
where cs.Group_NO='冊本編號' and md.meter_no is null;

3. in->inner join

查詢目的

還是上面的查詢背景,這裡查詢某天某個冊本已經上傳抄表數據的用戶信息。

in結構

select * 
from Customer cs
where 
cs.Group_No = '冊本編號' and
cs.Customer_No in 
(
    select Customer_No
    from Customer cs
    left join Meter me on cs.Customer_No = me.Customer_No
    inner join Meter_data md on me.meter_no = md.meter_no and md.date = '2019-04-09'
    where cs.Group_NO='冊本編號'
)

這裡使用in不夠高效,但是我們使用left join是否可以呢?

left join結構

select cs.*
from Customer cs
left join Meter me on cs.Customer_No = me.Customer_No
left join Meter_data md on me.meter_no = md.meter_no and md.date = '2019-04-09'
where cs.Group_NO='冊本編號' and md.meter_no is not null;

left join結構的話,這裡需要使用is not null作為篩選條件。但是is not null同樣非常低效。因此我們使用inner join

inner join結構

select cs.*
from Customer cs
left join Meter me on cs.Customer_No = me.Customer_No
inner join Meter_data md on me.meter_no = md.meter_no and md.date = '2019-04-09'
where cs.Group_NO='冊本編號';

inner join通過連接操作,直接獲取到已上傳抄表數據的用戶信息。

4. not in -> in -> inner join

前面的查詢場景中,我們預設的條件是未上傳抄表數據的用戶,當天在meter_data表是沒有記錄的。現在假設我們每天凌晨初始化meter_data表,設置抄表數值預設為零,抄表數據上傳預設為state=0未上傳。上傳後,更新抄表數值和抄表狀態state=1。

這時,我們來優化上面的not in查詢結構還有另外一種思路。

not in結構

select * 
from Customer cs
where 
cs.Group_No = '冊本編號' and
cs.Customer_No not in 
(
    select Customer_No
    from Customer cs
    left join Meter me on cs.Customer_No = me.Customer_No
    inner join Meter_data md on me.meter_no = md.meter_no and md.date = '2019-04-09'
    where cs.Group_NO='冊本編號' and meter.state=1
)

in結構

通過篩選條件取反,變換not in->in

select * 
from Customer cs
where 
cs.Group_No = '冊本編號' and
cs.Customer_No in 
(
    select Customer_No
    from Customer cs
    left join Meter me on cs.Customer_No = me.Customer_No
    inner join Meter_data md on me.meter_no = md.meter_no and md.date = '2019-04-09'
    where cs.Group_NO='冊本編號' and meter.state=0
)

inner join結構

select cs.*
from Customer cs
left join Meter me on cs.Customer_No = me.Customer_No
inner join Meter_data md on me.meter_no = md.meter_no and md.date = '2019-04-09'
where cs.Group_NO='冊本編號' and meter.state=0;

5. 總結如下

上面的查詢結構拆分出來後,大家可能覺得這麼簡單的sql怎麼可能寫成這個沙雕。其實真實業務系統,還有關聯其他將近10張表。這裡想說的是,在in\not in\except這種查詢結構時,如果涉及到的數據量較大,建議堅決用連接替換。

  • ... in (all except sub)... 查詢結構可以轉換為->left join
  • ... not in ... 查詢結構可以轉換為->left join
  • ... not in ... 查詢也可以轉換為 in -> inner join,這裡需要確認轉換查詢條件時,是否有對應的數據
  • ... in 查詢結構可以轉換為->inner join

您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • SQL操作符 算術操作符:+加, 減, 乘,/除 比較操作符: ,=,!=,,= 常用的判斷,和!=相同 between $lower_val$ and $hight_val$ between .. and.. 包括兩端 查詢20 ...
  • 這一篇筆記的mysql優化是註重於查詢優化,根據mysql的執行情況,判斷mysql什麼時候需要優化,關於資料庫開始階段的資料庫邏輯、物理結構的設計結構優化不是本文重點,下次再談 查看mysql語句的執行情況,判斷是否需要進行優化 以下分別通過java程式員可分析的前三個方面來討論mysql語句的查 ...
  • 1.按姓氏筆畫排序:Select * From TableName Order By CustomerName Collate Chinese_PRC_Stroke_ci_as 2.資料庫加密:select encrypt('原始密碼')select pwdencrypt('原始密碼')select ...
  • mysql優化二之鎖機制 mysql提供了鎖機制和MVCC機制來保證併發操作的安全性,這裡主要討論鎖機制, MVCC見下篇文章 mysql的鎖按照鎖粒度可分為行鎖與表鎖,按照操作類型劃分可讀鎖和寫鎖 InnoDB存儲引擎支持表鎖和行鎖,預設鎖為行鎖,MyIsam只支持表鎖 鎖粒度越高則併發性越好 表 ...
  • SQL中只有兩列數據(欄位1,欄位2),將其相同欄位1的行轉列 轉換前: 轉換後: 轉自:https://bbs.csdn.net/topics/392320974 ...
  • 一.Spark2.0的新特性Spark讓我們引以為豪的一點就是所創建的API簡單、直觀、便於使用,Spark 2.0延續了這一傳統,併在兩個方面凸顯了優勢: 1、標準的SQL支持; 2、數據框(DataFrame)/Dataset (數據集)API的統一。 在SQL方面,我們已經對Spark的SQL ...
  • 前言 關於資料庫鎖,是一個很重要的知識點; 不少人在開發的時候,應該 很少會註意到 這些鎖的問題,也很少會給程式加鎖(除了 庫存 這些對數量準確性要求極高的情況下); 一般也就聽過常說的樂觀鎖和悲觀鎖,瞭解過基本的含義之後就沒了,沒有去實際的操作過,本文將簡單的整理一下資料庫鎖的知識,希望對大家有所 ...
  • 數據導出時,出現錯誤: 一臉懵逼,百度了下,是導出數量有格式有限制。一開始導出為excel表格式,後改為文本格式,不會報錯。 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...