MySQL中Checkpoint技術_ZenDei技術網路在線

MySQL中Checkpoint技術

-Advertisement-

個人讀書筆記，詳情參考《MySQL技術內幕 Innodb存儲引擎》 1，checkpoint產生的背景資料庫在發生增刪查改操作的時候，都是先在buffer pool中完成的，為了提高事物操作的效率，buffer pool中修改之後的數據，並沒有立即寫入到磁碟，這有可能會導致記憶體中數據與磁碟中的數據產 ...

個人讀書筆記，詳情參考《MySQL技術內幕 Innodb存儲引擎》

1，checkpoint產生的背景
資料庫在發生增刪查改操作的時候，都是先在buffer pool中完成的，為了提高事物操作的效率，buffer pool中修改之後的數據，並沒有立即寫入到磁碟，這有可能會導致記憶體中數據與磁碟中的數據產生不一致的情況。
事物要求之一是持久性（Durability），buffer pool與磁碟數據的不一致性的情況下發生故障，可能會導致數據無法持久化。
為了防止在記憶體中修改但尚未寫入到磁碟的數據，在發生故障重啟數據之後產生事物未持久化的情況，是通過日誌(redo log)先行的方式來保證的。
redo log可以在故障重啟之後實現“重做”，保證了事物的持久化的特性，但是redo log空間不可能無限制擴大，對於記憶體中已修改但尚未提交到磁碟的數據，也即臟頁，也需要寫入磁碟。
對於記憶體中的臟頁，什麼時候，什麼情況下，將多少臟頁寫入磁碟，是由多方面因素決定的。
checkpoint的工作之一，就是對於記憶體中的臟頁，在一定條件下將臟頁刷新到磁碟。

2，checkpoint的分類
按照checkpoint刷新的方式，MySQL中的checkpoint分為兩種，也即sharp checkpoint和fuzzy checkpoint。
sharp checkpoint：在關閉資料庫的時候，將buffer pool中的臟頁全部刷新到磁碟中。
fuzzy checkpoint：資料庫正常運行時，在不同的時機，將部分臟頁寫入磁碟，進刷新部分臟頁到磁碟，也是為了避免一次刷新全部的臟頁造成的性能問題。

3 ，checkpoint發生的時機
checkpoint都是將buffer pool中的臟頁刷新到磁碟，但是在不同的情況下，checkpoint會被以不同的方式觸發，同時寫入到磁碟的臟頁的數量也不同。

3.1， Master Thread checkpoint
　　在Master Thread中，會以每秒或者每10秒一次的頻率，將部分臟頁從記憶體中刷新到磁碟，這個過程是非同步的。正常的用戶線程對數據的操作不會被阻塞。

3.2 ，FLUSH_LRU_LIST checkpoint
　　MySQL對緩存的管理是通過buffer pool中的LRU列表實現的，LRU 空閑列表中要保留一定數量的空閑頁面，來保證buffer pool中有足夠的空閑頁面來相應外界對資料庫的請求。
　　當這個空間頁面數量不足的時候，發生FLUSH_LRU_LIST checkpoint，FLUSH_LRU_LIST checkpoint是在單獨的page cleaner線程中執行的。
　　空閑頁的數量由innodb_lru_scan_depth參數表來控制的，因此在空閑列表頁面數量少於配置的值的時候，會發生checkpoint，剔除部分LRU列表尾端的頁面。

3.3 ，Async/Sync Flush checkpoint
　　Async/Sync Flush checkpoint 發生在重做日誌不可用的時候，將buffer pool中的一部分臟頁刷新到磁碟中，在臟頁寫入磁碟之後，事物對應的重做日誌也就可以釋放了。
　　關於redo_log文件的的大小，可以通過innodb_log_file_size來配置。

　　對於是執行Async Flush checkpoint還是Sync Flush checkpoint，由checkpoint_age以及async_water_mark和sync_water_mark來決定。
　　定義：
　　checkpoint_age = redo_lsn-checkpoint_lsn，也即checkpoint_age等於最新的lsn減去已經刷新到磁碟的lsn的值
　　async_water_mark 　　= 75%*innodb_log_file_size
　　sync_water_mark 　　 = 90%*innodb_log_file_size
　　1）當checkpoint_age<sync_water_mark的時候，無需執行Flush checkpoint。也就說，redo log剩餘空間超過25%的時候，無需執行Async/Sync Flush checkpoint。
　　2）當async_water_mark<checkpoint_age<sync_water_mark的時候，執行Async Flush checkpoint，也就說，redo log剩餘空間不足25%，但是大於10%的時候，執行Async Flush checkpoint，刷新到滿足條件1
　　3）當checkpoint_age>sync_water_mark的時候，執行sync Flush checkpoint。也就說，redo log剩餘空間不足10%的時候，執行Sync Flush checkpoint，刷新到滿足條件1。
　　在mysql 5.6之後，不管是Async Flush checkpoint還是Sync Flush checkpoint，都不會阻塞用戶的查詢進程。　

個人認為：
由於磁碟是一種相對較慢的存儲設備，記憶體與磁碟的交互是一個相對較慢的過程
由於innodb_log_file_size定義的是一個相對較大的值，正常情況下，由前面兩種checkpoint刷新臟頁到磁碟，在前面兩種checkpoint刷新臟頁到磁碟之後，臟頁對應的redo log空間隨即釋放，一般不會發生Async/Sync Flush checkpoint。同時也要意識到，為了避免頻繁低發生Async/Sync Flush checkpoint，也應該將innodb_log_file_size配置的相對較大一些。

3.4， Dirty Page too much Checkpoint
　　Dirty Page too much 意味著buffer pool中的臟頁過多，執行checkpoint臟頁刷入磁碟，保證buffer pool中有足夠的可用頁面。
　　Dirty Page 由innodb_max_dirty_pages_pct配置，innodb_max_dirty_pages_pct的預設值在innodb 1.0之前是90%，之後是75%。

總結：

MySQL資料庫（當然其他關係數據也有類似的機制），為了提高事物操作的效率，在事物提交之後並不會立即將修改後的數據寫入磁碟，而是通過日誌先行（write log ahead）的方式保證事物的持久性。
對於將事物修改的數據頁面，也即臟頁，通過非同步的方式刷新到磁碟中，checkpoint正是實現這種非同步刷新臟頁到磁碟的實施者。
不同的情況下，會發生不同的checkpoint，將不同數量的臟頁刷新到磁碟，從而到達管理記憶體（第1,2,4種checkpoint）和redo log可用空間（第3種checkpoint）的目的。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

c#快速導出到excel

導出到Excel，基本是很多單據的標配功能了。筆者之前將Datagridview的數據導出到Excel時，將數據一個單元格一個單元格的寫入，效率奇慢， 1030條數據花費了將近70s的時間。後來借鑒了前輩們的其它寫法，將數據先生成到string變數，再寫入，效率提升了150多倍。分享如下： 1、改善 ...
字元設備的另一種註冊方法

代碼如下： ~~~~ include include include include include include include include include include include include include / 確定主設備號 / static int major; static ...
github網站介紹、並使用git命令管理github(詳細描述)

本章學習: 1)熟悉github網站 2)通過git命令遠程管理github, 3)git命令使用ssh key密鑰無需輸入賬號密碼 1.首先我們來熟悉github網站 1.1 註冊github 登錄http://github.com/,然後點擊sign up,來註冊賬戶: 註冊好了,以及驗證郵箱後 ...
串口-CreateFile的使用

在32位的windows系統中，串口和其他通信設備是作為文件處理的。對串口的操作和對文件的操作是完全一樣的。通信以調用CreateFile()開始。函數原型如下：如果用CreateFile（）函數打開COM1，代碼如下： ...
通過資源監視器排查網路高占用異常

最近公司某台伺服器的網路占用經常達到99%，好像最高就是這麼多。使得很多服務受到影響，下麵就分享一下如何通過windows自帶的一些工具排查網路高占用異常。首先最簡單的是資源管理器，這個通過工具欄右鍵資源管理器，或者Ctrl+Alt+Del就可以調出來，然後點到聯網這一個標簽頁。在最下麵列出了機器 ...
搭建ngrok—內網穿透/映射神器

一、ngrok介紹及場景應用 1、介紹 ngrok是非常流行的反向代理服務，可以進行內網穿透，支持80埠以及自定義tcp埠轉發。這樣你就可以運行本地的程式,而讓別人通過公網訪問了 ngrok 是一個反向代理，通過在公共的端點和本地運行的 Web 伺服器之間建立一個安全的通道。ngrok 可捕獲和 ...
Linux的重要子目錄

1：網卡的配置文件 [ 同樣可以使用命令setup來執行網卡參數 2： DNS文件註：網卡的配置文件裡面如果配置了DNS，它的優先順序是高於這個配置文件的。 3： hosts文件 /etc/hosts 用戶IP與名稱（功能變數名稱）的對應解析的配置文件在實際的生產環境中很有用（一般所有的內網機器host ...
MySQL中文亂碼

MySQL中文亂碼處理找到my.ini文件(預設在C:\ProgramData\MySQL\MySQL Server 5.7文件夾下)；在my.ini中：搜索到[client]，修改或添加default-character-set=utf8; 搜索到[mysqld]，修改或添加characte ...