SQL優化之SQL 進階技巧(下)

来源:https://www.cnblogs.com/star8521/archive/2020/05/25/12954950.html
-Advertisement-
Play Games

上文( SQL優化之SQL 進階技巧(上) )我們簡述了 SQL 的一些進階技巧,一些朋友覺得不過癮,我們繼續來下篇,再送你 10 個技巧 一、 使用延遲查詢優化 limit [offset], [rows] 經常出現類似以下的 SQL 語句: SELECT FROM film LIMIT 1000 ...


上文SQL優化之SQL 進階技巧(上) )我們簡述了 SQL 的一些進階技巧,一些朋友覺得不過癮,我們繼續來下篇,再送你 10 個技巧

一、 使用延遲查詢優化 limit [offset], [rows]

經常出現類似以下的 SQL 語句:


SELECT * FROM film LIMIT 100000, 10

offset 特別大!

這是我司出現很多慢 SQL 的主要原因之一,尤其是在跑任務需要分頁執行時,經常跑著跑著 offset 就跑到幾十萬了,導致任務越跑越慢。

LIMIT 能很好地解決分頁問題,但如果 offset 過大的話,會造成嚴重的性能問題,原因主要是因為 MySQL 每次會把一整行都掃描出來,掃描 offset 遍,找到 offset 之後會拋棄 offset 之前的數據,再從 offset 開始讀取 10 條數據,顯然,這樣的讀取方式問題。

可以通過延遲查詢的方式來優化

假設有以下 SQL,有組合索引(sex, rating)


SELECT <cols> FROM profiles where sex='M' order by rating limit 100000, 10;

則上述寫法可以改成如下寫法


SELECT <cols> 
  FROM profiles 
inner join
(SELECT id form FROM profiles where x.sex='M' order by rating limit 100000, 10)
as x using(id);

這裡利用了覆蓋索引的特性,先從覆蓋索引中獲取 100010 個 id,再丟充掉前 100000 條 id,保留最後 10 個 id 即可,丟掉 100000 條 id 不是什麼大的開銷,所以這樣可以顯著提升性能

二、 利用 LIMIT 1 取得唯一行

資料庫引擎只要發現滿足條件的一行數據則立即停止掃描,,這種情況適用於只需查找一條滿足條件的數據的情況

三、 註意組合索引,要符合最左匹配原則才能生效

假設存在這樣順序的一個聯合索引“col_1, col_2, col_3”。這時,指定條件的順序就很重要。


○ SELECT * FROM SomeTable WHERE col_1 = 10 AND col_2 = 100 AND col_3 = 500;
○ SELECT * FROM SomeTable WHERE col_1 = 10 AND col_2 = 100 ;
× SELECT * FROM SomeTable WHERE col_2 = 100 AND col_3 = 500 ;

前面兩條會命中索引,第三條由於沒有先匹配 col_1,導致無法命中索引, 另外如果無法保證查詢條件里列的順序與索引一致,可以考慮將聯合索引 拆分為多個索引。

四、使用 LIKE 謂詞時,只有前方一致的匹配才能用到索引(最左匹配原則)


× SELECT * FROM SomeTable WHERE col_1 LIKE '%a';
× SELECT * FROM SomeTable WHERE col_1 LIKE '%a%';
○ SELECT * FROM SomeTable WHERE col_1 LIKE 'a%';

上例中,只有第三條會命中索引,前面兩條進行後方一致或中間一致的匹配無法命中索引

五、 簡單字元串表達式

模型字元串可以使用 _ 時, 儘可能避免使用 %, 假設某一列上為 char(5)

不推薦


SELECT 
    first_name, 
    last_name,
    homeroom_nbr
  FROM Students
 WHERE homeroom_nbr LIKE 'A-1%';

推薦

SELECT first_name, last_name
homeroom_nbr
  FROM Students
 WHERE homeroom_nbr LIKE 'A-1__'; --模式字元串中包含了兩個下劃線

六、儘量使用自增 id 作為主鍵

比如現在有一個用戶表,有人說身份證是唯一的,也可以用作主鍵,理論上確實可以,不過用身份證作主鍵的話,一是占用空間相對於自增主鍵大了很多,二是很容易引起頻繁的頁分裂,造成性能問題(什麼是頁分裂,請參考這篇文章

主鍵選擇的幾個原則:自增,儘量小,不要對主鍵進行修改

七、如何優化 count(*)

使用以下 sql 會導致慢查詢


SELECT COUNT(*) FROM SomeTable
SELECT COUNT(1) FROM SomeTable

原因是會造成全表掃描,有人說 COUNT(*) 不是會利用主鍵索引去查找嗎,怎麼還會慢,這就要談到 MySQL 中的聚簇索引和非聚簇索引了,聚簇索引葉子節點上存有主鍵值+整行數據,非聚簇索葉子節點上則存有輔助索引的列值 + 主鍵值,如下

SQL 進階技巧(下)

所以就算對 COUNT(*) 使用主鍵查找,由於每次取出主鍵索引的葉子節點時,取的是一整行的數據,效率必然不高,但是非聚簇索引葉子節點只存儲了「列值 + 主鍵值」,這也啟發我們可以用非聚簇索引來優化,假設表有一列叫 status, 為其加上索引後,可以用以下語句優化:

SELECT COUNT(status) FROM SomeTable

有人曾經測過(見文末參考鏈接),假設有 100 萬行數據,使用聚簇索引來查找行數的,比使用 COUNT(*) 查找速度快 10 幾倍。不過需要註意的是通過這種方式無法計算出  status 值為 null 的那些行

如果主鍵是連續的,可以利用 MAX(id) 來查找,MAX 也利用到了索引,只需要定位到最大 id 即可,性能極好,如下,秒現結果

SELECT MAX(id) FROM SomeTable

說句題句話,有人說用 MyISAM 引擎調用 COUNT(*) 非常快,那是因為它提前把行數存在磁碟中了,直接拿,當然很快,不過如果有 WHERE 的限制,用 COUNT(*) 還是很慢!

八、避免使用 SELECT * ,儘量利用覆蓋索引來優化性能

SELECT * 會提取出一整行的數據,如果查詢條件中用的是組合索引進行查找,還會導致回表(先根據組合索引找到葉子節點,再根據葉子節點上的主鍵回表查詢一整行),降低性能,而如果我們所要的數據就在組合索引里,只需讀取組合索引列,這樣網路帶寬將大大減少,假設有組合索引列 (col_1, col_2)

推薦用

SELECT col_1, col_2 
  FROM SomeTable 
 WHERE col_1 = xxx AND col_2 = xxx

不推薦用

SELECT *
  FROM SomeTable 
 WHERE col_1 = xxx AND  col_2 = xxx

九、 如有必要,使用 force index() 強制走某個索引

業務團隊曾經出現類似以下的慢 SQL 查詢

SELECT *
  FROM  SomeTable
 WHERE `status` = 0
   AND `gmt_create` > 1490025600
   AND `gmt_create` < 1490630400
   AND `id` > 0
   AND `post_id` IN ('67778', '67811', '67833', '67834', '67839', '67852', '67861', '67868', '67870', '67878', '67909', '67948', '67951', '67963', '67977', '67983', '67985', '67991', '68032', '68038'/*... omitted 480 items ...*/)
order by id asc limit 200;

post_id 也加了索引,理論上走 post_id 索引會很快查詢出來,但實際通過 EXPLAIN 發現走的卻是 id 的索引(這裡隱含了一個常見考點,在多個索引的情況下, MySQL 會如何選擇索引),而 id > 0 這個查詢條件沒啥用,直接導致了全表掃描, 所以在有多個索引的情況下一定要慎用,可以使用 force index 來強制走某個索引,以這個例子為例,可以強制走 post_id 索引,效果立桿見影。

這種由於表中有多個索引導致 MySQL 誤選索引造成慢查詢的情況在業務中也是非常常見,一方面是表索引太多,另一方面也是由於 SQL 語句本身太過複雜導致, 針對本例這種複雜的 SQL 查詢,其實用 ElasticSearch 搜索引擎來查找更合適,有機會到時出一篇文章說說。

十、 使用 EXPLAIN 來查看 SQL 執行計劃

上個點說了,可以使用 EXPLAIN 來分析 SQL 的執行情況,如怎麼發現上文中的最左匹配原則不生效呢,執行 「EXPLAIN + SQL 語句」可以發現 key 為 None ,說明確實沒有命中索引

SQL 進階技巧(下)

我司在提供 SQL 查詢的同時,也貼心地加了一個 EXPLAIN 功能及 sql 的優化建議,建議各大公司效仿 ^_^,如圖示

SQL 進階技巧(下)

十一、 批量插入,速度更快

當需要插入數據時,批量插入比逐條插入性能更高

推薦用

-- 批量插入
INSERT INTO TABLE (id, user_id, title) VALUES (1, 2, 'a'),(2,3,'b');

不推薦用

INSERT INTO TABLE (id, user_id, title) VALUES (1, 2, 'a');
INSERT INTO TABLE (id, user_id, title) VALUES (2,3,'b');

批量插入 SQL 執行效率高的主要原因是合併後日誌量 MySQL 的 binlog 和 innodb 的事務讓日誌減少了,降低日誌刷盤的數據量和頻率,從而提高了效率

十二、 慢日誌 SQL 定位

前面我們多次說了 SQL 的慢查詢,那麼該怎麼定位這些慢查詢 SQL 呢,主要用到了以下幾個參數

SQL 進階技巧(下)

這幾個參數一定要配好,再根據每條慢查詢對症下藥,像我司每天都會把這些慢查詢提取出來通過郵件給形式發送給各個業務團隊,以幫忙定位解決

總結

業務生產中可能還有很多 CASE 導致了慢查詢,其實細細品一下,都會發現這些都和 MySQL 索引的底層數據 B+ 樹 有莫大的關係,強烈建議大家看一下我的另一篇介紹 B+ 樹的文章,好評如潮!相信大家看了之後,以上出現的問題會有一個更深層次的理解,掌握底層,以不變應萬變!

相關文章

SQL優化之SQL 進階技巧(上)

SQL優化之SELECT COUNT(*)


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 1 準備工作 1.1 修改主機名 vim /etc/hosts # 添加對應主機 192.168.28.128 mha1 192.168.28.131 mha2 192.168.28.132 mha3 1.2 關閉防火牆及修改selinux # 關閉防火牆 systemctl stop firewa ...
  • 事務 資料庫併發控制的對象 事務是資料庫的邏輯工作單位 序列中的操作要麼全做,要麼全不做 特性; 原子性 一個事務中的所有操作是不可分割的,要麼全部執行,要麼 全部不執行,這就是事務的原子性。 一致性 一個被成功執行的事務,必須能使DB從一個一致性 狀態變為另一個一致性狀態。 隔離性 是指資料庫中一 ...
  • 操作異常 修改異常、插入異常、刪除異常 數據依賴 數據間的聯繫 函數依賴FD 屬性撿的聯繫,最基本的數據依賴 若確定X,則可以唯一的確定Y,則稱Y依賴於X記X->Y 若X->Y,且Y是X的子集則稱為平凡的函數依賴:平凡的FD 若X->Y且對於任何並且對於X的任何一 個真子集X′,都有X′ Y,則稱Y ...
  • 前提:建立了一個employee表,同時建立了一個組合索引lastName,gender 。 1.最常說的like匹配 例1 explain select * from employee where lastName like '%lucy'; 例2 explain select * from em ...
  • 一、什麼是Kafka? 數據工程中最具挑戰性的部分之一是如何從不同點收集和傳輸大量數據到分散式系統進行處理和分析。需要通過消息隊列正確地分離大量數據,因為如果一部分數據無法傳送,則可以在系統恢復時傳輸和分析其他數據。有兩種消息排隊,對於上述目的,它們都是可靠的和非同步的。點對點(Point to po ...
  • 一、數據安全性 1.用戶表示和鑒別 2.存取控制 3.定義視圖 4.審計 5.數據加密 二、伺服器級安全: 登入名(windows賬號登入、賬號密碼登入) 預設登入賬號:1.BUILTIN\Administrators 2.sa(管理員賬號,預設禁用,需啟用) 創建SQLsever登入賬號 crea ...
  • 前言 SQL優化之SQL 進階技巧(上) SQL優化之SQL 進階技巧(下)中提到使用以下 sql 會導致慢查詢 SELECT COUNT( ) FROM SomeTable SELECT COUNT(1) FROM SomeTable 原因是會造成全表掃描,有位讀者說這種說法是有問題的,實際上針對 ...
  • ​ ​ 在《 "什麼的是用戶畫像" 》一文中,我們已經知道用戶畫像對於企業的巨大意義,當然也有著非常大實時難度。那麼在用戶畫像的系統架構中都有哪些難度和重點要考慮的問題呢? 挑戰 大數據 隨著互聯網的崛起和智能手機的興起,以及物聯網帶來的各種可穿戴設備,我們能獲取的每一個用戶的數據量是非常巨大的,而 ...
一周排行
    -Advertisement-
    Play Games
  • 1. 說明 /* Performs operations on System.String instances that contain file or directory path information. These operations are performed in a cross-pla ...
  • 視頻地址:【WebApi+Vue3從0到1搭建《許可權管理系統》系列視頻:搭建JWT系統鑒權-嗶哩嗶哩】 https://b23.tv/R6cOcDO qq群:801913255 一、在appsettings.json中設置鑒權屬性 /*jwt鑒權*/ "JwtSetting": { "Issuer" ...
  • 引言 集成測試可在包含應用支持基礎結構(如資料庫、文件系統和網路)的級別上確保應用組件功能正常。 ASP.NET Core 通過將單元測試框架與測試 Web 主機和記憶體中測試伺服器結合使用來支持集成測試。 簡介 集成測試與單元測試相比,能夠在更廣泛的級別上評估應用的組件,確認多個組件一起工作以生成預 ...
  • 在.NET Emit編程中,我們探討了運算操作指令的重要性和應用。這些指令包括各種數學運算、位操作和比較操作,能夠在動態生成的代碼中實現對數據的處理和操作。通過這些指令,開發人員可以靈活地進行算術運算、邏輯運算和比較操作,從而實現各種複雜的演算法和邏輯......本篇之後,將進入第七部分:實戰項目 ...
  • 前言 多表頭表格是一個常見的業務需求,然而WPF中卻沒有預設實現這個功能,得益於WPF強大的控制項模板設計,我們可以通過修改控制項模板的方式自己實現它。 一、需求分析 下圖為一個典型的統計表格,統計1-12月的數據。 此時我們有一個需求,需要將月份按季度劃分,以便能夠直觀地看到季度統計數據,以下為該需求 ...
  • 如何將 ASP.NET Core MVC 項目的視圖分離到另一個項目 在當下這個年代 SPA 已是主流,人們早已忘記了 MVC 以及 Razor 的故事。但是在某些場景下 SSR 還是有意想不到效果。比如某些靜態頁面,比如追求首屏載入速度的時候。最近在項目中回歸傳統效果還是不錯。 有的時候我們希望將 ...
  • System.AggregateException: 發生一個或多個錯誤。 > Microsoft.WebTools.Shared.Exceptions.WebToolsException: 生成失敗。檢查輸出視窗瞭解更多詳細信息。 內部異常堆棧跟蹤的結尾 > (內部異常 #0) Microsoft ...
  • 引言 在上一章節我們實戰了在Asp.Net Core中的項目實戰,這一章節講解一下如何測試Asp.Net Core的中間件。 TestServer 還記得我們在集成測試中提供的TestServer嗎? TestServer 是由 Microsoft.AspNetCore.TestHost 包提供的。 ...
  • 在發現結果為真的WHEN子句時,CASE表達式的真假值判斷會終止,剩餘的WHEN子句會被忽略: CASE WHEN col_1 IN ('a', 'b') THEN '第一' WHEN col_1 IN ('a') THEN '第二' ELSE '其他' END 註意: 統一各分支返回的數據類型. ...
  • 在C#編程世界中,語法的精妙之處往往體現在那些看似微小卻極具影響力的符號與結構之中。其中,“_ =” 這一組合突然出現還真不知道什麼意思。本文將深入剖析“_ =” 的含義、工作原理及其在實際編程中的廣泛應用,揭示其作為C#語法奇兵的重要角色。 一、下劃線 _:神秘的棄元符號 下劃線 _ 在C#中並非 ...