性能優化之MySQL調優篇_ZenDei技術網路在線

MySQL對於很多Linux從業者而言，是一個非常棘手的問題，多數情況都是因為對資料庫出現問題的情況和處理思路不清晰。在進行MySQL的優化之前必須要瞭解的就是MySQL的查詢過程，很多的查詢優化工作實際上就是遵循一些原則讓MySQL的優化器能夠按照預想的合理方式運行而已。今天我們特別邀請了資深的 ...

MySQL對於很多Linux從業者而言，是一個非常棘手的問題，多數情況都是因為對資料庫出現問題的情況和處理思路不清晰。在進行MySQL的優化之前必須要瞭解的就是MySQL的查詢過程，很多的查詢優化工作實際上就是遵循一些原則讓MySQL的優化器能夠按照預想的合理方式運行而已。

今天我們特別邀請了資深的Linux運維老司機慘綠少年Linux來給大家體驗MySQL的優化實戰，助你高薪之路順暢。

圖 - MySQL查詢過程

1.2 優化的哲學

優化有風險，涉足需謹慎

1.2.1 優化可能帶來的問題

優化不總是對一個單純的環境進行，還很可能是一個複雜的已投產的系統。

優化手段本來就有很大的風險，只不過你沒能力意識到和預見到！

任何的技術可以解決一個問題，但必然存在帶來一個問題的風險！

對於優化來說解決問題而帶來的問題,控制在可接受的範圍內才是有成果。

保持現狀或出現更差的情況都是失敗！

1.2.2 優化的需求

穩定性和業務可持續性,通常比性能更重要！

優化不可避免涉及到變更，變更就有風險！

優化使性能變好，維持和變差是等概率事件！

切記優化,應該是各部門協同，共同參與的工作，任何單一部門都不能對資料庫進行優化！

所以優化工作,是由業務需要驅使的！！！

1.2.3 優化由誰參與

在進行資料庫優化時，應由資料庫管理員、業務部門代表、應用程式架構師、應用程式設計人員、應用程式開發人員、硬體及系統管理員、存儲管理員等，業務相關人員共同參與。

1.3 優化思路

1.3.1 優化什麼

在資料庫優化上有兩個主要方面：即安全與性能。

安全 ---> 數據可持續性

性能 ---> 數據的高性能訪問

1.3.2 優化的範圍有哪些

存儲、主機和操作系統方面:

主機架構穩定性
I/O規劃及配置
Swap交換分區
OS內核參數和網路問題

應用程式方面:

應用程式穩定性
SQL語句性能
串列訪問資源
性能欠佳會話管理
這個應用適不適合用MySQL

資料庫優化方面:

記憶體
資料庫結構(物理&邏輯)
實例配置

說明：不管是在，設計系統，定位問題還是優化，都可以按照這個順序執行。

1.3.3 優化維度

資料庫優化維度有四個:

硬體、系統配置、資料庫表結構、SQL及索引

優化選擇

優化成本:硬體>系統配置>資料庫表結構>SQL及索引
優化效果:硬體<系統配置<資料庫表結構<SQL及索引

1.4 優化工具有啥？

1.4.1 資料庫層面

檢查問題常用工具

mysql
msyqladmin mysql客戶端，可進行管理操作
mysqlshow 功能強大的查看shell命令show [SESSION | GLOBAL] variables 查看資料庫參數信息SHOW [SESSION | GLOBAL] STATUS 查看資料庫的狀態信息
information_schema 獲取元數據的方法SHOW ENGINE INNODB STATUS Innodb引擎的所有狀態SHOW PROCESSLIST 查看當前所有連接session狀態explain 獲取查詢語句的執行計劃show index 查看表的索引信息
slow-log 記錄慢查詢語句
mysqldumpslow 分析slowlog文件的

不常用但好用的工具

zabbix 監控主機、系統、資料庫（部署zabbix監控平臺）
pt-query-digest 分析慢日誌
mysqlslap 分析慢日誌
sysbench 壓力測試工具
mysql profiling 統計資料庫整體狀態工具 
Performance Schema mysql性能狀態統計的數據
workbench 管理、備份、監控、分析、優化工具（比較費資源）

1.4.2 資料庫層面問題解決思路

一般應急調優的思路：

針對突然的業務辦理卡頓，無法進行正常的業務處理！需要立馬解決的場景！

1、show processlist

2、explain select id ,name from stu where name='clsn'; # ALL id name age sex

select id,name from stu where id=2-1 函數結果集>30;

show index from table;

3、通過執行計劃判斷，索引問題（有沒有、合不合理）或者語句本身問題

4、show status like '%lock%'; # 查詢鎖狀態

kill SESSION_ID; # 殺掉有問題的session

常規調優思路：

針對業務周期性的卡頓，例如在每天10-11點業務特別慢，但是還能夠使用，過了這段時間就好了。

1、查看slowlog，分析slowlog，分析出查詢慢的語句。

2、按照一定優先順序，進行一個一個的排查所有慢語句。

3、分析top sql，進行explain調試，查看語句執行時間。

4、調整索引或語句本身。

1.4.3 系統層面

cpu方面

vmstat、sar top、htop、nmon、mpstat

記憶體

free 、ps -aux 、

IO設備（磁碟、網路）

iostat 、 ss 、 netstat 、 iptraf、iftop、lsof、

vmstat 命令說明：

Procs：r顯示有多少進程正在等待CPU時間。b顯示處於不可中斷的休眠的進程數量。在等待I/O

Memory：swpd顯示被交換到磁碟的數據塊的數量。未被使用的數據塊，用戶緩衝數據塊，用於操作系統的數據塊的數量

想要瞭解更多性能優化知識的，可以加群：650385180

Swap：操作系統每秒從磁碟上交換到記憶體和從記憶體交換到磁碟的數據塊的數量。s1和s0最好是0

Io：每秒從設備中讀入b1的寫入到設備b0的數據塊的數量。反映了磁碟I/O

System：顯示了每秒發生中斷的數量(in)和上下文交換(cs)的數量

Cpu：顯示用於運行用戶代碼，系統代碼，空閑，等待I/O的CPU時間

iostat命令說明

實例命令： iostat -dk 1 5

iostat -d -k -x 5 （查看設備使用率（%util）和響應時間（await））

tps：該設備每秒的傳輸次數。“一次傳輸”意思是“一次I/O請求”。多個邏輯請求可能會被合併為“一次I/O請求”。

iops ：硬體出廠的時候，廠家定義的一個每秒最大的IO次數

"一次傳輸"請求的大小是未知的。

kB_read/s：每秒從設備（drive expressed）讀取的數據量；

KB_wrtn/s：每秒向設備（drive expressed）寫入的數據量；

kB_read：讀取的總數據量；

kB_wrtn：寫入的總數量數據量；這些單位都為Kilobytes。

1.4.4 系統層面問題解決辦法

你認為到底負載高好，還是低好呢？

在實際的生產中，一般認為 cpu只要不超過90%都沒什麼問題。

當然不排除下麵這些特殊情況：

問題一：cpu負載高，IO負載低

記憶體不夠

磁碟性能差

SQL問題 ------>去資料庫層，進一步排查sql問題

IO出問題了（磁碟到臨界了、raid設計不好、raid降級、鎖、在單位時間內tps過高）

tps過高: 大量的小數據IO、大量的全表掃描

問題二：IO負載高，cpu負載低

大量小的IO 寫操作：

autocommit ，產生大量小IO

IO/PS,磁碟的一個定值，硬體出廠的時候，廠家定義的一個每秒最大的IO次數。

大量大的IO 寫操作

SQL問題的幾率比較大

問題三：IO和cpu負載都很高

硬體不夠了或sql存在問題

1.5 基礎優化

1.5.1 優化思路

定位問題點吮吸

硬體 --> 系統 --> 應用 --> 資料庫 --> 架構（高可用、讀寫分離、分庫分表）

處理方向

明確優化目標、性能和安全的折中、防患未然

1.5.2 硬體優化

主機方面：

根據資料庫類型，主機CPU選擇、記憶體容量選擇、磁碟選擇
平衡記憶體和磁碟資源
隨機的I/O和順序的I/O
主機 RAID卡的BBU(Battery Backup Unit)關閉

cpu的選擇：

cpu的兩個關鍵因素：核數、主頻
根據不同的業務類型進行選擇：
cpu密集型：計算比較多，OLTP 主頻很高的cpu、核數還要多
IO密集型：查詢比較，OLAP 核數要多，主頻不一定高的

記憶體的選擇：

OLAP類型資料庫，需要更多記憶體，和數據獲取量級有關。
OLTP類型數據一般記憶體是cpu核心數量的2倍到4倍，沒有最佳實踐。

存儲方面：

根據存儲數據種類的不同，選擇不同的存儲設備
配置合理的RAID級別(raid5、raid10、熱備盤)
對與操作系統來講，不需要太特殊的選擇，最好做好冗餘（raid1）（ssd、sas 、sata）
raid卡：主機raid卡選擇：

實現操作系統磁碟的冗餘（raid1）
平衡記憶體和磁碟資源
隨機的I/O和順序的I/O
主機 RAID卡的BBU(Battery Backup Unit)要關閉。

網路設備方面：

使用流量支持更高的網路設備（交換機、路由器、網線、網卡、HBA卡）

註意：以上這些規劃應該在初始設計系統時就應該考慮好。

1.5.3 伺服器硬體優化

1、物理狀態燈：

2、自帶管理設備：遠程式控制制卡（FENCE設備：ipmi ilo idarc），開關機、硬體監控。

3、第三方的監控軟體、設備（snmp、agent）對物理設施進行監控

4、存儲設備：自帶的監控平臺。EMC2（hp收購了），日立（hds），IBM低端OEM hds，高端存儲是自己技術，華為存儲

1.5.4 系統優化

Cpu：

基本不需要調整，在硬體選擇方面下功夫即可。

記憶體：

基本不需要調整，在硬體選擇方面下功夫即可。

SWAP：

MySQL儘量避免使用swap。

阿裡雲的伺服器中預設swap為0

IO ：

raid、no lvm、 ext4或xfs、ssd、IO調度策略

Swap調整(不使用swap分區)

/proc/sys/vm/swappiness的內容改成0（臨時），/etc/sysctl.conf上添加vm.swappiness=0（永久）

這個參數決定了Linux是傾向於使用swap，還是傾向於釋放文件系統cache。在記憶體緊張的情況下，數值越低越傾向於釋放文件系統cache。

當然，這個參數只能減少使用swap的概率，並不能避免Linux使用swap。

修改MySQL的配置參數innodb_flush_method，開啟O_DIRECT模式。

這種情況下，InnoDB的buffer pool會直接繞過文件系統cache來訪問磁碟，但是redo log依舊會使用文件系統cache。

值得註意的是，Redo log是覆寫模式的，即使使用了文件系統的cache，也不會占用太多

IO調度策略

#echo deadline>/sys/block/sda/queue/scheduler 臨時修改為deadline

永久修改

vi /boot/grub/grub.conf

更改到如下內容:

kernel /boot/vmlinuz-2.6.18-8.el5 ro root=LABEL=/ elevator=deadline rhgb quiet

1.5.5 系統參數調整

Linux系統內核參數優化

vim /etc/sysctl.conf 
 net.ipv4.ip_local_port_range = 1024 65535 # 用戶埠範圍 
 net.ipv4.tcp_max_syn_backlog = 4096 
 net.ipv4.tcp_fin_timeout = 30 
 fs.file-max=65535 # 系統最大文件句柄，控制的是能打開文件最大數量

用戶限制參數（mysql可以不設置以下配置）

vim /etc/security/limits.conf 
 * soft nproc 65535 
 * hard nproc 65535 
 * soft nofile 65535 
 * hard nofile 65535

1.5.6 應用優化

業務應用和資料庫應用獨立,

防火牆：iptables、selinux等其他無用服務(關閉)：

chkconfig --level 23456 acpid off 
 chkconfig --level 23456 anacron off 
 chkconfig --level 23456 autofs off 
 chkconfig --level 23456 avahi-daemon off 
 chkconfig --level 23456 bluetooth off 
 chkconfig --level 23456 cups off 
 chkconfig --level 23456 firstboot off 
 chkconfig --level 23456 haldaemon off 
 chkconfig --level 23456 hplip off 
 chkconfig --level 23456 ip6tables off 
 chkconfig --level 23456 iptables off 
 chkconfig --level 23456 isdn off 
 chkconfig --level 23456 pcscd off 
 chkconfig --level 23456 sendmail off 
 chkconfig --level 23456 yum-updatesd off

安裝圖形界面的伺服器不要啟動圖形界面 runlevel 3

另外，思考將來我們的業務是否真的需要MySQL，還是使用其他種類的資料庫。用資料庫的最高境界就是不用資料庫。

1.6 資料庫優化

SQL優化方向：

執行計劃、索引、SQL改寫

架構優化方向：

高可用架構、高性能架構、分庫分表

1.6.1 資料庫參數優化

調整：

實例整體（高級優化，擴展）：

thread_concurrency # 併發線程數量個數 sort_buffer_size # 排序緩存 read_buffer_size # 順序讀取緩存 read_rnd_buffer_size # 隨機讀取緩存 key_buffer_size # 索引緩存 thread_cache_size # (1G—>8, 2G—>16, 3G—>32, >3G—>64)

連接層（基礎優化）

設置合理的連接客戶和連接方式

max_connections # 最大連接數，看交易筆數設置 max_connect_errors # 最大錯誤連接數，能大則大 connect_timeout # 連接超時 max_user_connections # 最大用戶連接數 skip-name-resolve # 跳過功能變數名稱解析 wait_timeout # 等待超時 back_log # 可以在堆棧中的連接數量

SQL層（基礎優化）

query_cache_size：查詢緩存

>>>

OLAP類型資料庫,需要重點加大此記憶體緩存，

但是一般不會超過GB

對於經常被修改的數據，緩存會立馬失效。

我們可以實用記憶體資料庫（redis、memecache），替代他的功能。

1.6.2 存儲引擎層（innodb基礎優化參數）

default-storage-engine 
innodb_buffer_pool_size # 沒有固定大小，50%測試值，看看情況再微調。但是儘量設置不要超過物理記憶體70% innodb_file_per_table=(1,0) 
innodb_flush_log_at_trx_commit=(0,1,2) # 1是最安全的，0是性能最高，2折中 
binlog_sync 
Innodb_flush_method=(O_DIRECT, fdatasync) 
innodb_log_buffer_size # 100M以下 innodb_log_file_size # 100M 以下 innodb_log_files_in_group # 5個成員以下,一般2-3個夠用（iblogfile0-N） innodb_max_dirty_pages_pct # 達到百分之75的時候刷寫 記憶體臟頁到磁碟。 log_bin 
max_binlog_cache_size # 可以不設置 max_binlog_size # 可以不設置 innodb_additional_mem_pool_size #小於2G記憶體的機器，推薦值是20M。32G記憶體以上100M

1.6.3 想要瞭解更多性能優化知識的，可以關註我，後續也會給大家整理出來一份系統的關於性能優化的知識腦圖，另外順便給大家推薦一個交流學習群：650385180，裡面會分享一些資深架構師錄製的視頻錄像：有Spring，MyBatis，Netty源碼分析，高併發、高性能、分散式、微服務架構的原理，JVM性能優化這些成為架構師必備的知識體系。還能領取免費的學習資源，目前受益良多，以下的結構體系圖也是在群里獲取。