聊聊MySQL是如何處理排序的

来源:https://www.cnblogs.com/huaweiyun/p/18195305
-Advertisement-
Play Games

在MySQL的查詢中常常會用到 order by 和 group by 這兩個關鍵字,它們的相同點是都會對欄位進行排序,那查詢語句中的排序是如何實現的呢? ...


本文分享自華為雲社區《MySQL怎樣處理排序⭐️如何優化需要排序的查詢?》,作者:菜菜的後端私房菜。

前言

在MySQL的查詢中常常會用到 order by 和 group by 這兩個關鍵字

它們的相同點是都會對欄位進行排序,那查詢語句中的排序是如何實現的呢?

當使用的查詢語句需要進行排序時有兩種處理情況:

  1. 當前記錄本來就是有序的,不需要進行排序
  2. 當前記錄未保持順序,需要排序

使用索引保證有序

對於第一種情況,常常是使用二級索引中索引列的有序來保證結果集有序,從而不需要進行排序

對於表a,為a2建立二級索引,那麼在二級索引上a2就是有序的

 CREATE TABLE `a` (
   `a1` int(11) NOT NULL AUTO_INCREMENT,
   `a2` varchar(255) CHARACTER SET utf8mb4 DEFAULT NULL,
   `a3` varchar(255) DEFAULT NULL,
   PRIMARY KEY (`a1`),
   KEY `idx_a2` (`a2`)
 ) ENGINE=InnoDB AUTO_INCREMENT=76 DEFAULT CHARSET=utf8;

select * from a order by a.a2 limit 10

當優化器選擇使用a2索引時,a2列的記錄本身就是有序的,因此不需要再使用其他開銷進行排序

image.png

當然,優化器也有可能不使用a2索引(當優化器認為使用a2回表開銷太大時會使用全表掃描)

image.png

當優化器使用的索引上a2無序時,則會通過其他手段對結果進行排序

filesort

當執行計劃的Extra附加信息中出現 Using filesort 時,會使用sort_buffer對結果進行排序

sort_buffer是一塊用於排序的記憶體,sort_buffer可能存放查詢需要的所有欄位,也可能只存放需要排序的欄位和主鍵

show variables like 'max_length_for_sort_data'

當查詢需要的欄位長度小於 max_length_for_sort_data 時,則會將查詢需要的所有欄位放入sort_buffer中,然後對需要排序的列進行排序,最後返回結果

image.png

當查詢需要的欄位長度大於 max_length_for_sort_data 時,只會將需要排序的欄位和主鍵值放入sort_buffer中,等到排序後再去查詢聚簇索引獲取需要查詢的列(相當於又多了一次回表)

image.png

在sort_buffer中進行排序時,如果記憶體足夠則會在記憶體中進行排序,如果記憶體不夠則會使用磁碟的臨時文件來輔助排序

開啟 optimizer_trace 可以查看是否使用臨時文件輔助排序

 #開啟優化器追蹤
 SET optimizer_trace='enabled=on'; 
 ​
 #sql語句
 select * from student order by student_name limit 10000;
 ​
 #查看優化器追蹤的信息
 SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G;

排序使用的演算法是歸併演算法,先分割成多個小文件排序再進行合併

其中number_of_tmp_files 為使用到的臨時文件數量,sort_buffer_size 為sort_buffer大小

image.png

因此當使用order by、group by等需要排序的關鍵字時,最好建立合適的索引

如果數據量小可以在sort buffer中排序,如果數據量太大還需要與磁碟交互

總結

當查詢語句需要排序時會分為不用排序和需要排序兩種情況

當使用的索引有序時則不用再進行排序,通過索引來保證有序

當使用的索引無序時則會使用sort_buffer進行排序,當查詢欄位的長度未超過限制時,sort_buffer中每條記錄會存儲需要查詢的列

如果超過限制,則sort_buffer只會存儲需要排序的列和主鍵值,排序後再通過主鍵值進行回表獲取需要查詢的列

當數據量太大不夠在記憶體中排序完,會使用磁碟頁輔助排序,使用歸併演算法將排序數據分散在多個頁再合併

可以通過追蹤優化器 optimizer_trace 分析內容查看輔助頁的數量等信息

為需要排序的列建立合適的索引,避免使用磁碟頁輔助排序

當無法使用索引時可以調整sort buffer 或 max_length_for_sort_data(謹慎)

 

點擊關註,第一時間瞭解華為雲新鮮技術~

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • KylinV10SP2實現ARM和x86架構系統PXE部署(S3) 本文介紹在esxi(虛擬化)中Centos7.9操作系統上部署PXE服務端,集成麒麟系統安裝源,TFTP服務,DHCP服務,HTTP服務,能夠向裸機發送PXE引導程式、Linux內核、啟動菜單等數據,以及提供安裝文件。 系統引導模式 ...
  • 大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家介紹的是恩智浦i.MX RT1170 uSDHC eMMC啟動時間。 本篇是 i.MXRT1170 啟動時間評測第五彈,前四篇分別給大家評測了 Raw NAND 啟動時間(基於 MIMXRT1170-EVK_Rev.B)、Serial NOR ...
  • 在Linux中可以不需要有腳本或者二進位程式的文件在文件系統上實際存在,只需要有對應的數據在記憶體中,就有辦法執行這些腳本和程式。 原理其實很簡單,Linux里有辦法把某塊記憶體映射成文件描述符,對於每一個文件描述符,Linux會在/proc/self/fd/<文件描述符>這個路徑上創建一個對應描述符的 ...
  • 目錄開源庫移植步驟[1]:下載庫的源碼包[2]:解壓,且閱讀“README(自述文件)",瞭解對應庫的使用規則[3]:打開源碼中的install.txt的文本,學習庫的移植和安裝步驟[4]:把下載好的源碼包jpegsrc.v9f.tar.gz發送到linux系統的家目錄下進行解壓[5] :“配置” ...
  • PWM
    PWM PWM 1. 什麼是PWM? 2. 面積等效原理 2.1. 什麼是面積等效原理? 2.2. 面積等效原理的理解 3. 相關概念 3.1. 周期和頻率 3.2. 占空比 4. 總結 參考鏈接 others 1. 什麼是PWM? PWM是Pulse Width Modulation的縮寫,中文是 ...
  • 筆者使用SeaTunnel 2.3.2版本將Doris數據同步到Hive(cdh-6.3.2)首次運行時有如下報錯,並附上報錯的解決方案: java.lang.NoClassDefFoundError: org/apache/hadoop/hive/metastore/api/MetaExcepti ...
  • 2024年5月15日,白鯨開源CEO郭煒在2024 DataOps發展大會上被正式聘任為DataOps專家,並獲得了榮譽證書。本次大會由中國通信標準化協會主辦,中關村科學城管委會提供支持,大數據技術標準推進委員會(CCSATC601)承辦,旨在推動DataOps領域的標準化和實踐發展。 在大會的圓桌 ...
  • 指標設計是企業戰略落地、經營決策支持和績效評估的基礎。在數字化轉型的大背景下,準確有效的指標體系能夠幫助企業快速響應市場變化,優化資源配置,提升運營效率。因此,科學合理的指標設計不僅是技術實現的問題,更是企業戰略方向和業務邏輯的體現。 企業指標體系設計面臨的典型困境 企業在構建指標體系的征途中,常遭 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...