聊聊MySQL是如何處理排序的

来源:https://www.cnblogs.com/huaweiyun/p/18195305
-Advertisement-
Play Games

在MySQL的查詢中常常會用到 order by 和 group by 這兩個關鍵字,它們的相同點是都會對欄位進行排序,那查詢語句中的排序是如何實現的呢? ...


本文分享自華為雲社區《MySQL怎樣處理排序⭐️如何優化需要排序的查詢?》,作者:菜菜的後端私房菜。

前言

在MySQL的查詢中常常會用到 order by 和 group by 這兩個關鍵字

它們的相同點是都會對欄位進行排序,那查詢語句中的排序是如何實現的呢?

當使用的查詢語句需要進行排序時有兩種處理情況:

  1. 當前記錄本來就是有序的,不需要進行排序
  2. 當前記錄未保持順序,需要排序

使用索引保證有序

對於第一種情況,常常是使用二級索引中索引列的有序來保證結果集有序,從而不需要進行排序

對於表a,為a2建立二級索引,那麼在二級索引上a2就是有序的

 CREATE TABLE `a` (
   `a1` int(11) NOT NULL AUTO_INCREMENT,
   `a2` varchar(255) CHARACTER SET utf8mb4 DEFAULT NULL,
   `a3` varchar(255) DEFAULT NULL,
   PRIMARY KEY (`a1`),
   KEY `idx_a2` (`a2`)
 ) ENGINE=InnoDB AUTO_INCREMENT=76 DEFAULT CHARSET=utf8;

select * from a order by a.a2 limit 10

當優化器選擇使用a2索引時,a2列的記錄本身就是有序的,因此不需要再使用其他開銷進行排序

image.png

當然,優化器也有可能不使用a2索引(當優化器認為使用a2回表開銷太大時會使用全表掃描)

image.png

當優化器使用的索引上a2無序時,則會通過其他手段對結果進行排序

filesort

當執行計劃的Extra附加信息中出現 Using filesort 時,會使用sort_buffer對結果進行排序

sort_buffer是一塊用於排序的記憶體,sort_buffer可能存放查詢需要的所有欄位,也可能只存放需要排序的欄位和主鍵

show variables like 'max_length_for_sort_data'

當查詢需要的欄位長度小於 max_length_for_sort_data 時,則會將查詢需要的所有欄位放入sort_buffer中,然後對需要排序的列進行排序,最後返回結果

image.png

當查詢需要的欄位長度大於 max_length_for_sort_data 時,只會將需要排序的欄位和主鍵值放入sort_buffer中,等到排序後再去查詢聚簇索引獲取需要查詢的列(相當於又多了一次回表)

image.png

在sort_buffer中進行排序時,如果記憶體足夠則會在記憶體中進行排序,如果記憶體不夠則會使用磁碟的臨時文件來輔助排序

開啟 optimizer_trace 可以查看是否使用臨時文件輔助排序

 #開啟優化器追蹤
 SET optimizer_trace='enabled=on'; 
 ​
 #sql語句
 select * from student order by student_name limit 10000;
 ​
 #查看優化器追蹤的信息
 SELECT * FROM `information_schema`.`OPTIMIZER_TRACE`\G;

排序使用的演算法是歸併演算法,先分割成多個小文件排序再進行合併

其中number_of_tmp_files 為使用到的臨時文件數量,sort_buffer_size 為sort_buffer大小

image.png

因此當使用order by、group by等需要排序的關鍵字時,最好建立合適的索引

如果數據量小可以在sort buffer中排序,如果數據量太大還需要與磁碟交互

總結

當查詢語句需要排序時會分為不用排序和需要排序兩種情況

當使用的索引有序時則不用再進行排序,通過索引來保證有序

當使用的索引無序時則會使用sort_buffer進行排序,當查詢欄位的長度未超過限制時,sort_buffer中每條記錄會存儲需要查詢的列

如果超過限制,則sort_buffer只會存儲需要排序的列和主鍵值,排序後再通過主鍵值進行回表獲取需要查詢的列

當數據量太大不夠在記憶體中排序完,會使用磁碟頁輔助排序,使用歸併演算法將排序數據分散在多個頁再合併

可以通過追蹤優化器 optimizer_trace 分析內容查看輔助頁的數量等信息

為需要排序的列建立合適的索引,避免使用磁碟頁輔助排序

當無法使用索引時可以調整sort buffer 或 max_length_for_sort_data(謹慎)

 

點擊關註,第一時間瞭解華為雲新鮮技術~

 


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • KylinV10SP2實現ARM和x86架構系統PXE部署(S3) 本文介紹在esxi(虛擬化)中Centos7.9操作系統上部署PXE服務端,集成麒麟系統安裝源,TFTP服務,DHCP服務,HTTP服務,能夠向裸機發送PXE引導程式、Linux內核、啟動菜單等數據,以及提供安裝文件。 系統引導模式 ...
  • 大家好,我是痞子衡,是正經搞技術的痞子。今天痞子衡給大家介紹的是恩智浦i.MX RT1170 uSDHC eMMC啟動時間。 本篇是 i.MXRT1170 啟動時間評測第五彈,前四篇分別給大家評測了 Raw NAND 啟動時間(基於 MIMXRT1170-EVK_Rev.B)、Serial NOR ...
  • 在Linux中可以不需要有腳本或者二進位程式的文件在文件系統上實際存在,只需要有對應的數據在記憶體中,就有辦法執行這些腳本和程式。 原理其實很簡單,Linux里有辦法把某塊記憶體映射成文件描述符,對於每一個文件描述符,Linux會在/proc/self/fd/<文件描述符>這個路徑上創建一個對應描述符的 ...
  • 目錄開源庫移植步驟[1]:下載庫的源碼包[2]:解壓,且閱讀“README(自述文件)",瞭解對應庫的使用規則[3]:打開源碼中的install.txt的文本,學習庫的移植和安裝步驟[4]:把下載好的源碼包jpegsrc.v9f.tar.gz發送到linux系統的家目錄下進行解壓[5] :“配置” ...
  • PWM
    PWM PWM 1. 什麼是PWM? 2. 面積等效原理 2.1. 什麼是面積等效原理? 2.2. 面積等效原理的理解 3. 相關概念 3.1. 周期和頻率 3.2. 占空比 4. 總結 參考鏈接 others 1. 什麼是PWM? PWM是Pulse Width Modulation的縮寫,中文是 ...
  • 筆者使用SeaTunnel 2.3.2版本將Doris數據同步到Hive(cdh-6.3.2)首次運行時有如下報錯,並附上報錯的解決方案: java.lang.NoClassDefFoundError: org/apache/hadoop/hive/metastore/api/MetaExcepti ...
  • 2024年5月15日,白鯨開源CEO郭煒在2024 DataOps發展大會上被正式聘任為DataOps專家,並獲得了榮譽證書。本次大會由中國通信標準化協會主辦,中關村科學城管委會提供支持,大數據技術標準推進委員會(CCSATC601)承辦,旨在推動DataOps領域的標準化和實踐發展。 在大會的圓桌 ...
  • 指標設計是企業戰略落地、經營決策支持和績效評估的基礎。在數字化轉型的大背景下,準確有效的指標體系能夠幫助企業快速響應市場變化,優化資源配置,提升運營效率。因此,科學合理的指標設計不僅是技術實現的問題,更是企業戰略方向和業務邏輯的體現。 企業指標體系設計面臨的典型困境 企業在構建指標體系的征途中,常遭 ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...