當我們希望MySQL能夠以更高的性能運行查詢時,最好的辦法就是弄清楚MySQL是如何優化和執行查詢的。一旦理解了這一點,很多查詢優化工作實際上就是遵循一些原則讓優化器能夠按照預想的合理方式運行 ...
當我們希望MySQL能夠以更高的性能運行查詢時,最好的辦法就是弄清楚MySQL是如何優化和執行查詢的。一旦理解了這一點,很多查詢優化工作實際上就是遵循一些原則讓優化器能夠按照預想的合理方式運行
當我們想向MySQL發送了一個請求時,MySQL到底做了什麼:
- 客戶端首先發送一條查詢請求給伺服器
- 伺服器首先檢查查詢緩存,如果命中了緩存,則立刻返回存儲在緩存中的結果,否則進入下一階段。
- 伺服器端進行SQL解析、預處理,再由優化器生成對應的執行計劃
- MySQL根據優化器生成的執行計劃,調用存儲引擎的API來執行查詢
- 將結果返回客戶端
MySQL客戶端/伺服器通信協議
MySQL客戶端和伺服器之間的通信協議是“半雙工”的,這意味著,在任何一個時刻,要麼是由伺服器向客戶端發送數據,要麼是由客戶端向伺服器發送數據,這兩個動作不能同時發生。所以,我們無法也無需將一個消息切成小塊獨立來發送。
這種協議雖然讓MySQL通信簡單快速,但是也從很多地方限制了MySQL。一個明顯的限制是,這意味著沒法進行流量控制。一旦一端開始傳送信息,另一端要接收完整個信息才能夠響應它。
客戶端使用一個單獨的數據包將查詢傳給伺服器,當查詢語句太長時,服務端就會拒絕接受更多的數據並且拋出相應的錯誤。因此,當查詢語句很長時,參數max_allowed_packet就特別重要。
相反的,一般伺服器響應給用戶的數據通常很多,由多個數據包組成。當伺服器開始相應客戶端請求時,客戶端必須完整的接受整個返回結果,而不能簡單的只取前幾條結果。
換而言之,當客戶端從伺服器獲取數據時,MySQL會一直向客戶端推送數據,客戶端也沒法讓伺服器停下來。
查詢狀態
對於一個MySQL連接或者說一個線程,任何時刻都有一個狀態,該狀態表示了MySQL當前正在做什麼:
- Sleep: 線程正在等待客戶端發送新的請求
- Query: 線程正在執行查詢或者正在將結果發送給客戶端
- Locked: 在MySQL伺服器層,該線程正在等待表鎖
- Analyzing and statistics: 線程正在收集存儲引擎的統計信息,並生成查詢的執行計劃
- Copying and tmp table [on disk]: 線程正在執行查詢,並將其結果集都複製到一個臨時表中,這種狀態要麼就是在做GROUP BY 操作,要麼就是文件排序操作。如果這個狀態後面還有 on disk標記,那麼表示MySQL正在將一個記憶體臨時表存放在磁碟上
- Sorting result: 線程正在對結果集進行排序
- Sending data: 這表示多種情況:線程可能在多個狀態之間傳送數據,或者生成結果集,或者在向客戶端返回數據
查詢緩存
在解析一個查詢語句之前,如果查詢緩存是打開的,那麼MySQL會優先檢查這個查詢是否命中查詢緩存中的數據,這個檢查是通過一個對大小寫敏感的哈希查找實現的。
查詢和緩存中的查詢即使只有一個位元組不同,也不會匹配緩存結果。這種情況下查詢就會進入下一個階段。
如果當前的查詢恰好命中了查詢緩存,那麼在返回查詢結果之前MySQL會檢查一次用戶許可權。這仍然是無需解析查詢SQL語句的,因為在查詢緩存中已經存放了當前查詢所需要訪問的表信息。
如果許可權沒有問題,MySQL就會跳過所有其他階段,直接從緩存表中拿到結果並且返回給客戶端。在這種情況下,查詢不會被解析,不用生成執行計劃,不會被執行。
查詢優化處理
查詢的生命周期的下一步是將一個SQL轉換成一個執行接話,MySQL再按照這個執行計劃和存儲引擎進行交互。
這包括多個子階段:解析SQL、預處理、優化SQL執行接話。
這些過程中任何出錯都可能終止查詢。
查詢執行引擎
在解析和優化階段,MySQL將會生成查詢對應的執行接話,MySQL的查詢執行引擎則根據這個執行計劃來完成整個查詢。這裡的執行計劃是一個數據結構,而不是其他很多關係型資料庫那樣的位元組碼。
相對於查詢優化階段,查詢執行階段並不那麼複雜:MySQL只是簡單的根據執行計劃給出的指令逐步執行。在根據執行計劃逐步執行的過程中,有大量的操作需要通過調用存儲引擎實現的介面來完成。
返回結果給客戶端
查詢執行的最後一個階段是將結果返回給客戶端。及時查詢不需要返回結果給客戶端,MySQL仍然會返回這個查詢的信息,如該查詢影響到的行數。
在這個階段中,如果查詢是可以被緩存的,那麼MySQL在這個階段也將會被存放到查詢緩存中。
MySQL將結果集返回給客戶端是一個增量地、逐步返回的過程。這樣做有兩個好處:伺服器端無需存儲太多的結果,也就不會因為要返回太多結果而消耗太多記憶體。這樣的處理也會讓MySQL客戶端第一時間獲得返回的結果。
結果集中的每一行都會以一個滿足MySQL客戶端/伺服器通信協議的封包發送,再通過TCP協議進行傳輸,在TCP傳輸中,可能會對MySQL的封包進行緩存然後批量傳輸。