多版本併發控制 MVCC

来源:https://www.cnblogs.com/feiyu2/archive/2022/09/14/mvcc.html
-Advertisement-
Play Games

介紹多版本併發控制 多版本併發控制技術(Multiversion Concurrency Control,MVCC) 技術是為瞭解決問題而生的,通過 MVCC 我們可以解決以下幾個問題: 讀寫之間阻塞的問題:通過 MVCC 可以讓讀寫互相不阻塞,即讀不阻塞寫,寫不阻塞讀,這樣就可以提升事務併發處理能 ...


介紹多版本併發控制

多版本併發控制技術(Multiversion Concurrency Control,MVCC)

技術是為瞭解決問題而生的,通過 MVCC 我們可以解決以下幾個問題:

  1. 讀寫之間阻塞的問題:通過 MVCC 可以讓讀寫互相不阻塞,即讀不阻塞寫,寫不阻塞讀,這樣就可以提升事務併發處理能力。
  2. 降低了死鎖的概率:這是因為 MVCC 沒有使用鎖,讀取數據時並不需要加鎖,對於寫操作,也只鎖定必要的行。
  3. 解決一致性讀的問題:一致性讀也被稱為快照讀,當我們查詢資料庫在某個時間點的快照時,只能看到這個時間點之前事務提交更新的結果,而不能看到這個時間點之後事務提交更新的結果。

MVCC 的思想

MVCC 是通過數據行的歷史版本來實現資料庫的併發控制。

簡單來說 MVCC 的思想就是保存數據的歷史版本。這樣一個事務進行查詢操作時,就可以通過比較版本號來判斷哪個較新的版本對當前事務可見。

InnoDB 對 MVCC 的實現

MVCC 沒有正式的標準,所以在不同的 DBMS 中,MVCC 的實現方式可能是不同的。

InnoDB 對 MVCC 的實現主要是通過 版本鏈 + ReadView 結構完成。

版本鏈存儲記錄的多個版本

先介紹聚簇索引記錄的隱藏列,再介紹 Undo Log 版本鏈


對於使用 InnoDB 存儲引擎的表來說,它的聚簇索引記錄中都包含 3 個隱藏列

  1. db_row_id:隱藏的行 ID。在沒有自定義主鍵也沒有 Unique 鍵的情況下,會使用該隱藏列作為主鍵。
  2. db_trx_id:操作這個數據的事務 ID,也就是最後一個對該數據進行插入或更新的事務 ID。
  3. db_roll_ptr:回滾指針,也就是指向這個記錄的 Undo Log 信息。Undo Log 中存儲了回滾需要的數據。

事務ID

事務執行過程中,只有在第一次真正修改記錄時(比如進行 insert、delete、update 操作),才會被分配一個唯一的、單調遞增的事務 ID,如果沒有修改記錄操作,按照一定的策略分配一個比較大的事務 ID,減少分配事務 ID 的鎖競爭。每當事務向資料庫寫入新內容時, 所寫的數據都會被標記操作所屬的事務的事務ID。


在 InnoDB 存儲引擎中,版本鏈由數據行的 Undo Log 組成。

每次對數據行進行修改,都會將舊值記錄到 Undo Log,算是該數據行的一個舊版本。

Undo Log 有兩個重要的屬性:db_roll_ptr、db_trx_id

  • Undo Log 也有一個 db_roll_ptr 屬性(insert 操作對應的 Undo Log 沒有 db_roll_ptr 屬性,因為 insert 操作對應的數據行沒有更早的版本),Undo Log 的 db_roll_ptr 屬性指向上一次操作的 Undo Log,所有的版本被 db_roll_ptr 屬性連接形成一個鏈表。該鏈表即版本鏈,版本鏈的頭節點就是數據行的最新值。

  • Undo Log 還包含生成該版本時,對應的事務 ID,用於判斷當前版本的數據對事務的可見性。

版本鏈如下圖所示。這樣如果我們想要查找歷史快照,就可以通過遍歷回滾指針的方式進行查找。

file

ReadView 判斷版本鏈中的哪個較新的版本對當前事務是可見的

ReadView 用來判斷版本鏈中的哪個較新的版本對當前事務是可見的。

ReadView 中主要包含 4 個比較重要的屬性:

  • m_ids:表示在生成 ReadView 時,當前系統中所有活躍的讀寫事務的 ID 集合(列表)
  • min_transaction_id:表示在生成 ReadView 時,m_ids 中的最小值
  • max_transaction_id:表示在生成 ReadView 時,系統應該分配給下一個事務的 ID 值
  • creator_transaction_id:表示生成該 ReadView 的事務的 ID

有了這個 ReadView,這樣在訪問某條記錄時,就可以用 ReadView 來判斷版本鏈中的哪個較新的版本對當前事務是可見的。

  • 如果被訪問版本的 transaction_id 屬性值與 ReadView 中的 creator_trx_id 值相同,表明當前事務在訪問它自己修改過的記錄,所以該版本可以被當前事務訪問。

  • 如果被訪問版本的 transaction_id 屬性值 小於 ReadView 中的 min_trx_id 值,表明生成該版本的事務在當前事務生成 ReadView 前已經提交了,所以該版本可以被當前事務訪問。

  • 如果被訪問版本的 transaction_id 屬性值 大於 ReadView 中的 max_trx_id 值,表明生成該版本的事務在當前事務生成 ReadView 後才開啟,所以該版本不可以被當前事務訪問。

  • 如果被訪問版本的 transaction_id 屬性值在 ReadView 的 min_trx_id 和 max_trx_id 之間,那就需要判斷一下 transaction_id 屬性值是不是在 m_ids 列表中:

    • 如果在,表明生成 ReadView 時,被訪問版本的事務還是活躍的,所以該版本不可以被當前事務訪問
    • 如果不在,表明生成 ReadView 時,被訪問版本的事務已經被提交了,所以該版本可以被當前事務訪問

如果某個版本的數據對當前事務不可見的話,那就順著版本鏈找到下一個版本的數據,繼續按照上邊的步驟判斷

可見性,依此類推,直到版本鏈中的最後一個版本。如果最後一個版本也不可見的話,那麼就意味著該條記錄對當前事務完全不可見,查詢結果就不包含該記錄。

ReadView 的生成時機

MVCC 可以防止臟讀,也可以防止不可重覆讀。

防止臟讀 和 防止不可重覆讀 實現的不同之處就在:ReadView 的生成時機不同

  • 防止臟讀:每次讀取數據前,都生成一個 ReadView
  • 防止不可重覆讀:在當前事務第一次讀取數據時,生成一個 ReadView,之後的查詢操作都重覆使用這個 ReadView

對於隔離級別為 讀未提交 的事務來說,直接讀取記錄的最新版本即可。

對於隔離級別為 串列化 的事務來說,InnoDB 存儲引擎使用加鎖的方式來訪問記錄。

對於隔離級別為 讀已提交 和 可重覆讀 的事務來說,都必須保證只能讀到已經提交的事務修改的數據,不能讀到未提交的事務修改的數據。

參考資料

MySQL 是怎樣運行的:從根兒上理解 MySQL - 小孩子4919 - 掘金課程 (juejin.cn)

本文來自博客園,作者:真正的飛魚,轉載請註明原文鏈接:https://www.cnblogs.com/feiyu2/p/mvcc.html


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一、argparse簡介 argparse 是 python 自帶的命令行參數解析包,可以用來方便的服務命令行參數,使用之前需要先導入包 import argparse 二、簡單案例 簡單使用,創建一個名為test.py的文件 # 導入 argparse 模塊 import argparse # 創 ...
  • 在實際業務中,當後臺數據發生變化,客戶端能夠實時的收到通知,而不是由用戶主動的進行頁面刷新才能查看,這將是一個非常人性化的設計 ...
  • 【Shashlik.EventBus】.NET 事件匯流排,分散式事務最終一致性 簡介 github https://github.com/dotnet-shashlik/shashlik.eventbus 各位爺高興了給個star唄。 分散式事務、CAP定理、事件匯流排,在當前微服務、分散式、集群大行 ...
  • 閱讀須知:本文為入門介紹、指引文章,所示代碼皆為最簡易(或僅為實現功能)的演示示例版本,不一定切實符合個人(企業)實際開發需求。 一、DbContext生存期 DbContext 的生存期從創建實例時開始,併在釋放實例時結束。 DbContext 實例旨在用於單個工作單元。這意味著 DbContex ...
  • 1. 文件系統:用來存儲、組織、管理文件的一套方式、協議 2. 文件 文件的屬性:i-node唯一表示一個文件的存在與否 文件的內容 3. Linux系統如何實現文件的操作? 硬體層: inode(屬性) >文件的內容 Linux內核: struct inode{}用來描述一個文件的屋裡inode的 ...
  • 前言 想必在linux上寫過程式的同學都有分析進程占用多少記憶體的經歷,或者被問到這樣的問題——你的程式在運行時占用了多少記憶體(物理記憶體)? 通常我們可以通過top命令查看進程占用了多少記憶體。這裡我們可以看到VIRT、RES和SHR三個重要的指標,他們分別代表什麼意思呢? 這是本文需要跟大家一起探討的 ...
  • 近日,騰訊雲MySQL發佈新架構,在基礎硬體能力、自研內核及外部網路延遲等方面進行了全面升級。 在探究新版本實際性能的過程中,測試人員通過基準測試工具SysBench以及全模擬業務生產環境,分別針對只寫、只讀以及混合讀寫場景進行性能測試。其結果顯示,新架構下的雲資料庫MySQL在性能上比原有架構提升 ...
  • 摘要:不要歪了,我這裡說特性它不是 bug,而是故意設計的機制或語法,你有可能天天寫語句或許還沒發現原來還能這樣用,沒關係我們一起學下漲姿勢。 本文分享自華為雲社區《【雲駐共創】天天寫 SQL,你遇到了哪些神奇的特性?》,作者: 龍哥手記 。 一 SQL 的第一個神奇特性 日常開發我們經常會對錶進行 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...