pt-query-digest查找不太適合的sql語句,判斷是否是最有的索引策略 ...
pt-query-digest
1. 概述
索引可以我們更快速的執行查詢,但是肯定存在不合理的索引,如果想找到那些索引不是很合適的查詢,併在它們成為問題前進行優化,則可以使用pt-query-digest的查詢審查“review”功能,分析其EXPLAIN出來的執行計劃。
pt-query-digest是用於分析mysql慢查詢的一個工具,它可以分析binlog、General log、slowlog,也可以通過SHOWPROCESSLIST或者通過tcpdump抓取的MySQL協議數據來進行分析。可以把分析結果輸出到文件中,分析過程是先對查詢語句的條件進行參數化,然後對參數化以後的查詢進行分組統計,統計出各查詢的執行時間、次數、占比等,可以藉助分析結果找出問題進行優化。
2. 工具安裝
pt-query-digest是一個perl腳本,只需下載並賦權即可執行。
[root@test1 ]# wget percona.com/get/pt-query-digest
[root@test1 ]# chmod u+x pt-query-digest
3. 工具執行
3.1 直接分析慢查詢文件
pt-query-digest slow.log > slow_report.log
3.2 分析最近12小時內的查詢
pt-query-digest --since=12h slow.log > slow_report2.log
3.3 分析指定時間範圍內的查詢
pt-query-digest slow.log --since '2014-04-17 09:30:00' --until '2014-04-17 10:00:00'> > slow_report3.log
3.4 分析指含有select語句的慢查詢
pt-query-digest--filter '$event->{fingerprint} =~ m/^select/i' slow.log> slow_report4.log
3.5 針對某個用戶的慢查詢
pt-query-digest--filter '($event->{user} || "") =~ m/^root/i' slow.log> slow_report5.log
3.6 查詢所有所有的全表掃描或full join的慢查詢
pt-query-digest--filter '(($event->{Full_scan} || "") eq "yes") ||(($event->{Full_join} || "") eq "yes")' slow.log> slow_report6.log
3.7 把查詢保存到query_review表
pt-query-digest --user=root –password=abc123 --review h=localhost,D=test,t=query_review--create-review-table slow.log
3.8 把查詢保存到query_history表
pt-query-digest --user=root –password=abc123 --review h=localhost,D=test,t=query_ history--create-review-table slow.log_20140401
pt-query-digest --user=root –password=abc123--review h=localhost,D=test,t=query_history--create-review-table slow.log_20140402
3.9 通過tcpdump抓取mysql的tcp協議數據,然後再分析
tcpdump -s 65535 -x -nn -q -tttt -i any -c 1000 port 3306 > mysql.tcp.txt
pt-query-digest --type tcpdump mysql.tcp.txt> slow_report9.log
3.10 分析binlog
mysqlbinlog mysql-bin.000093 > mysql-bin000093.sql
pt-query-digest --type=binlog mysql-bin000093.sql > slow_report10.log
3.11 分析general log
pt-query-digest --type=genlog localhost.log > slow_report11.log
4. 報告分析
4.1 總體統計結果
Overall: 總共有多少條查詢,上例為總共109個查詢。
unique: 唯一查詢數量,即對查詢條件進行參數化以後,總共有多少個不同的查詢,該例為8。(去重後的語句)
Time range: 查詢執行的時間範圍。
total: 總計 ;min:最小;max: 最大;avg:平均;95%: 把所有值從小到大排列,位置位於95%的那個數,這個數一般最具有參考價值;median: 中位數,把所有值從小到大排列,位置位於中間那個數。
4.2 查詢分組統計結果
這部分對查詢進行參數化並分組,然後對各類查詢的執行情況進行分析,結果按總執行時長,從大到小排序。
Response: 總的響應時間。
time: 該查詢在本次分析中總的時間占比。
calls: 執行次數,即本次分析總共有多少條這種類型的查詢語句。
R/Call: 平均每次執行的響應時間。
Item : 查詢對象
4.3 每一種查詢的詳細統計結果
查詢的詳細統計結果,最上面的表格列出了執行次數、最大、最小、平均、95%等各項目的統計。
Databases: 庫名
Users: 各個用戶執行的次數(占比)
Query_time distribution : 查詢時間分佈, 長短體現區間占比,本例中10s以上的查詢雙是1s-10s之間的兩倍。
Tables: 查詢中涉及到的表
Explain: 示例
5. 語法及重要選項
pt-query-digest [OPTIONS] [FILES] [DSN]
--create-review-table 當使用--review參數把分析結果輸出到表中時,如果沒有表就自動創建。
--create-history-table 當使用--history參數把分析結果輸出到表中時,如果沒有表就自動創建。
--filter 對輸入的慢查詢按指定的字元串進行匹配過濾後再進行分析
--limit 限制輸出結果百分比或數量,預設值是20,即將最慢的20條語句輸出,如果是50%則按總響應時間占比從大到小排序,輸出到總和達到50%位置截止。
--host mysql伺服器地址
--user mysql用戶名
--password mysql用戶密碼
--history 將分析結果保存到表中,分析結果比較詳細,下次再使用--history時,如果存在相同的語句,且查詢所在的時間區間和歷史表中的不同,則會記錄到數據表中,可以通過查詢同一CHECKSUM來比較某類型查詢的歷史變化。
--review 將分析結果保存到表中,這個分析只是對查詢條件進行參數化,一個類型的查詢一條記錄,比較簡單。當下次使用--review時,如果存在相同的語句分析,就不會記錄到數據表中。
--output 分析結果輸出類型,值可以是report(標準分析報告)、slowlog(Mysql slow log)、json、json-anon,一般使用report,以便於閱讀。
--since 從什麼時間開始分析,值為字元串,可以是指定的某個”yyyy-mm-dd [hh:mm:ss]”格式的時間點,也可以是簡單的一個時間值:s(秒)、h(小時)、m(分鐘)、d(天),如12h就表示從12小時前開始統計。
--until 截止時間,配合--since可以分析一段時間內的慢查詢。
6. 備註
開啟mysql慢查詢,打開配置文件(一般在該路徑下vim /etc/my.cnf),增加以下配置,修改完成後重啟mysql服務
//慢查詢
log-output=FILE
slow_query_log=1
slow_query_log_file=/data/dbdata/slow_query.log
long-query-time=1
log-queries-not-using-indexes
7. 參考文檔
http://blog.csdn.net/seteor/article/details/24017913