手機站首頁散文詩歌雜文隨筆日記小小說

散文網 » 生活 »日常 » 值得收藏，揭秘 MySQL 多版本并發(fā)控制實現原理

值得收藏，揭秘 MySQL 多版本并發(fā)控制實現原理

2023-07-13 19:57 作者:全家桶激活 0人讀過 | 我要投稿

MySQL 中多版本并發(fā)控制（MVCC），是現代數據庫引擎實現中常用的處理讀寫沖突的手段，MVCC 作為 MySQL 高級應用特性，目的在于提高數據庫高并發(fā)場景下的吞吐性能。

一、MVCC出現背景是什么？

事務的4個隔離級別以及對應的3種異常：

臟讀：一個事務讀取到了另外一個事務沒有提交的數據；
不可重復讀：在同一事務中，兩次讀取同一數據，得到內容不同；
幻讀：同一事務中，用同樣的操作讀取兩次，得到的記錄數不相同。

在 MySQL 中，默認的隔離級別是可重復讀，可以解決臟讀和不可重復讀的問題，但不能解決幻讀問題。如果我們想要解決幻讀問題，就需要采用串行化的方式，也就是將隔離級別提升到最高，但這樣一來就會大幅降低數據庫的事務并發(fā)能力。而MVCC就是通過樂觀鎖的方式來解決不可重復讀和幻讀問題，它可以在大多數情況下替代行級鎖，降低系統(tǒng)的開銷。MySQL 并發(fā)事務會引起更新丟失問題，解決辦法是鎖，主要分兩類：

樂觀鎖：
其實現如同它的名字一樣，是假設比較好的情況。
每次取數據的時候都認為他人不會對其修改，所以不會上鎖，但是在更新的時候會判斷一下在此期間別人有沒有去更新這個數據，可以使用版本號機制和CAS算法實現。
悲觀鎖：
悲觀鎖也如同它的名字一樣，總是假設比較壞的情況，每次取數據的時候都認為他人會修改，所以每次在拿數據的時候都會上鎖，這樣別人想拿這個數據就會阻塞直到它拿到鎖（共享資源每次只給一個線程使用，其它線程阻塞，用完后再把資源轉讓給其它線程）。

二、什么是MVCC，它解決了什么問題？

MVCC 是通過數據行的多個版本管理來實現數據庫的并發(fā)控制，簡單來說它的思想就是保存數據的歷史版本。

我們可以通過比較版本號決定數據是否顯示出來（具體的規(guī)則后面會介紹到），讀取數據的時候不需要加鎖也可以保證事務的隔離效果。

（1）讀寫之間阻塞的問題，通過 MVCC 可以讓讀寫互相不阻塞，即讀不阻塞寫，寫不阻塞讀，這樣就可以提升事務并發(fā)處理能力。（2）降低了死鎖的概率。這是因為 MVCC 采用了樂觀鎖的方式，讀取數據時并不需要加鎖，對于寫操作，也只鎖定必要的行。（3）解決一致性讀的問題。一致性讀也被稱為快照讀，當我們查詢數據庫在某個時間點的快照時，只能看到這個時間點之前事務提交更新的結果，而不能看到這個時間點之后事務提交的更新結果。

快照讀：
讀取的是快照數據，不加鎖的簡單的SELECT都屬于快照讀（只是普通的讀操作）。
當前讀：
當前讀就是讀取最新數據，而不是歷史版本的數據。
加鎖的SELECT，或者對數據進行增刪改都會進行當前讀（包括加鎖的讀取和DML操作）。

三、應用舉例分析

為了更好地讓大家理解MVCC，我們用一個示例場景來說明。假設有個賬戶金額表 user_balance，包括三個字段，分別是 username 用戶名、balance 余額和 bankcard 卡號，表數據如下所示：

用戶 A 和用戶 B 之間進行轉賬，此時數據庫管理員想要查詢 user_balance 表中的總金額，兩個場景存在并發(fā)情況，在沒有MVCC的情況下，會出現哪些問題呢。Case1：因為需要采用加行鎖的方式，用戶 A 給 B 轉賬時間等待很久，如下圖所示。

Case2：當我們讀取的時候用了加行鎖，可能會出現死鎖的情況，如下圖所示。

比如當我們讀到 A 有 1000 元的時候，此時 B 開始執(zhí)行給 A 轉賬。

四、InnoDB如何實現MVCC？

首先獲取事務自己的版本號，也就是事務 ID；
獲取 Read View；
查詢得到的數據，然后與 Read View 中的事務版本號進行比較；
如果不符合 ReadView 規(guī)則，就需要從 Undo Log 中獲取歷史快照；
最后返回符合規(guī)則的數據。

一個自增長的事務ID，用于標記事務執(zhí)行的先后順序。在 MVCC 機制中，多個事務對同一個行記錄進行更新會產生多個歷史快照，這些歷史快照保存在 Undo Log 里。如果一個事務想要查詢這個行記錄，需要讀取哪個版本的行記錄呢？這時就需要用到 Read View 了，它幫我們解決了行的可見性問題。Read View 保存了當前事務開啟時所有活躍（還沒有提交）的事務列表，換個角度，可以理解為 Read View 保存了不應該讓這個事務看到的其他的事務 ID 列表。Read VIew 中的幾個重要屬性：

up_limit_id，活躍的事務中最小的事務 ID；
trx_ids，系統(tǒng)當前正在活躍的事務 ID 集合；
low_limit_id，活躍的事務中最大的事務 ID；
creator_trx_id，創(chuàng)建這個 Read View 的事務 ID。

InnoDB 的葉子節(jié)點段存儲了數據頁，數據頁中保存了行記錄，在這些行記錄中有一些重要的隱藏字段：

DB_ROW_ID ：
6-byte，記錄操作該數據事務的事務ID；
DB_TRX_ID ：
6-byte，當創(chuàng)建表沒有合適的索引作為聚集索引時，會用該隱藏ID創(chuàng)建聚集索引；
DB_ROLL_PTR ：
7-byte，回滾指針，指向上一個版本數據在undo log 里的位置指針；

聚集索引是指數據庫表行中數據的物理順序與鍵值的邏輯（索引）順序相同。一個表只能有一個聚集索引，因為一個表的物理順序只有一種情況，所以，對應的聚集索引只能有一個。InnoDB 將行記錄快照保存在 Undo Log，可以在回滾段中找到它們，主要用于記錄數據被修改之前的日志，在對表信息做修改之前先會把數據拷貝到Undo Log里，當事務進行回滾時可以通過Undo Log里的日志進行數據還原?；貪L段中回滾指針間關聯關系，如下圖所示：

五、InnoDB是如何解決幻讀的？
1、在讀已提交的情況下，即使采用了 MVCC 方式也會出現幻讀

我們同時開啟事務 A 和事務 B，先在事務 A 中進行某個條件范圍的查詢，讀取的時候采用排它鎖，在事務 B 中增加一條符合該條件范圍的數據，并進行提交，然后我們在事務 A 中再次查詢該條件范圍的數據，就會發(fā)現結果集中多出一個符合條件的數據，這樣就出現了幻讀。

出現幻讀的原因是在讀已提交的情況下，InnoDB 只采用記錄鎖（Record Locking）。

記錄鎖：
針對單個行記錄添加鎖。
間隙鎖（Gap Locking）：
可以鎖住一個范圍（索引之間的空隙），但不包括記錄本身。
采用間隙鎖的方式可以防止幻讀情況的產生。
Next-Key 鎖：
鎖住一個范圍，同時鎖定記錄本身，相當于間隙鎖 + 記錄鎖，可以解決幻讀的問題。

2、在可重復讀的情況下，InnoDB 可以通過 Next-Key 鎖 +MVCC 來解決幻讀問題。想插入球員艾利克斯·倫（身高 2.16 米）的時候，事務 B 會超時，無法插入該數據。這是因為采用了 Next-Key 鎖，會將 height>2.08 的范圍都進行鎖定，就無法插入符合這個范圍的數據了。然后事務 A 重新進行條件范圍的查詢，就不會出現幻讀的情況。

六、總結

MVCC 的核心就是 Undo Log+ Read View。

“MV”就是通過 Undo Log 來保存數據的歷史版本，實現多版本的管理；
“CC”是通過 Read View 來實現管理，通過 Read View 原則來決定數據是否顯示。

同時針對不同的隔離級別，Read View 的生成策略不同，也就實現了不同的隔離級別。

本文使用文章同步助手同步

標簽：