記憶體淘汰策略|頁面置換演算法對比總結

来源:https://www.cnblogs.com/swx123/archive/2023/04/06/17294517.html
-Advertisement-
Play Games

在學習【操作系統】 【MySQL】【Redis】後,發現其都有一些緩存淘汰的策略,因此一篇小文章總結一下。 目前還沒著筆,初略一想MySQL和操作系統應該都是使用的年輕代和老生代的改進策略,而Redis使用的是隨機抽的策略。 MySQL MySQL中存在一個記憶體緩存池,Buffer Pool。裡面存 ...


在學習【操作系統】 【MySQL】【Redis】後,發現其都有一些緩存淘汰的策略,因此一篇小文章總結一下。

目前還沒著筆,初略一想MySQL和操作系統應該都是使用的年輕代和老生代的改進策略,而Redis使用的是隨機抽的策略。

MySQL

MySQL中存在一個記憶體緩存池,Buffer Pool。裡面存在著控制塊和緩存的數據頁(當然還有些其他緩存,比如:鎖信息、undo頁等)。

下麵的LRU限制在緩存的數據頁當中(控制塊等應該也是不會淘汰的)

有了緩存池之後

  • 當讀取數據時,如果數據存在於 Buffer Pool 中,客戶端就會直接讀取 Buffer Pool 中的數據,否則再去磁碟中讀取。
  • 當修改數據時,首先是修改 Buffer Pool 中數據所在的頁,然後將其頁設置為臟頁,最後由後臺線程將臟頁寫入到磁碟。

MySQL會直接操作緩存池中的數據,然後再刷新到磁碟中。
Buffer Pool中MySQL還會維護三個鏈表,分別為:LRU鏈表,dirty page 鏈表與free page鏈表。三個鏈表存在分別的意義為:

  • LRU鏈表:記憶體是有限的,不能無限讀入數據,此LRU鏈表key方便決定要淘汰哪些頁面。---也正是本文的核心,記憶體淘汰策略。
  • dirty page 鏈表:為了方便確認哪些數據頁是臟頁,要刷新入磁碟。
  • free page鏈表:為了方便確認哪些頁還沒有讀入數據。

Pasted image 20230404203815.png

由三個鏈表的功能可以知道,最開始free list是滿的(數據還沒有讀入),隨後會越來越少。

Buffer Pool 的大小是有限的,對於一些頻繁訪問的數據我們希望可以一直留在 Buffer Pool 中,而一些很少訪問的數據希望可以在某些時機可以淘汰掉,從而保證 Buffer Pool 不會因為滿了而導致無法再緩存新的數據,同時還能保證常用數據留在 Buffer Pool 中。
要實現這個,最容易想到的就是 LRU(Least recently used)演算法。
該演算法的思路是,鏈表頭部的節點是最近使用的,而鏈表末尾的節點是最久沒被使用的。那麼,當空間不夠了,就淘汰最久沒被使用的節點,從而騰出空間。
簡單的 LRU 演算法的實現思路是這樣的:

  • 當訪問的頁在 Buffer Pool 里,就直接把該頁對應的 LRU 鏈表節點移動到鏈表的頭部。
  • 當訪問的頁不在 Buffer Pool 里,除了要把頁放入到 LRU 鏈表的頭部,還要淘汰 LRU 鏈表末尾的節點。

簡單的LRU演算法會有兩個問題:預讀失效緩存污染

MySQL解決這兩個問題的基本思路:

  1. 解決預讀失效:將緩存區分為新生代和老生代。預讀的數據讀入老生代(優先淘汰),如果真正使用了才會加入新生代。
  2. 解決緩存污染:由於預讀的數據只要使用了就加入新生代,即使用一次就加入新生代,後面就算不用了新生代也全部被這些只用了一次的數據污染了。因此解決方案就是提高進入新生代的代價。

具體來說,為瞭解決緩存污染:MySQL 是這樣做的,進入到 young 區域條件增加了一個停留在 **old** 區域的時間判斷
具體是這樣做的,在對某個處在 old 區域的緩存頁進行第一次訪問時,就在它對應的控制塊中記錄下來這個訪問時間:

  • 如果後續的訪問時間與第一次訪問的時間在某個時間間隔內,那麼該緩存頁就不會被從 old 區域移動到 young 區域的頭部
  • 如果後續的訪問時間與第一次訪問的時間不在某個時間間隔內,那麼該緩存頁移動到 young 區域的頭部

這個間隔時間是由 innodb_old_blocks_time 控制的,預設是 1000 ms。
也就說,只有同時滿足「被訪問」與「在 old 區域停留時間超過 1 秒」兩個條件,才會被插入到 young 區域頭部,這樣就解決了 Buffer Pool 污染的問題 。
另外,MySQL 針對 young 區域其實做了一個優化,為了防止 young 區域節點頻繁移動到頭部。young 區域前面 1/4 被訪問不會移動到鏈表頭部,只有後面的 3/4被訪問了才會。

這個優化非常有意思,因為越靠前的區域就是越熱點的數據,可能來回訪問就是那幾個熱點數據,因此特別熱點的數據訪問就不用來回移動了hhh。

操作系統

參考:

當 CPU 訪問的頁面不在物理記憶體時,便會產生一個缺頁中斷,請求操作系統將所缺頁調入到物理記憶體。
這個將所缺頁調入到物理記憶體的過程也會涉及到記憶體淘汰策略。

不同的是操作系統淘汰的是頁表,而MySQL淘汰的是數據頁。其實本質上都是一樣的hhh。
所缺頁調入到物理記憶體的步驟大概為:

  1. 首先查找頁表,找對應的頁表項,如果頁表項中的狀態位為「無效的」,就觸發缺頁中斷。
  2. 去磁碟找對應頁面在磁碟中的位置,讀取出來。
  3. 準備換入:物理記憶體中找空閑頁,有就換入。沒有就自然涉及了記憶體頁面置換的一些策略了。
  4. 將頁表項中的狀態位設置為[有效的],重新執行對應的觸發缺頁中斷的代碼。

image.png

記憶體淘汰策略演算法目標則是,儘可能減少頁面的換入換出的次數,常見的頁面置換演算法有如下幾種:

  • 最佳頁面置換演算法(OPT):這是理論上的最優演算法,因為未來不可知,所以是理論上的。它是一個頁面置換演算法的上限。
  • 先進先出置換演算法(FIFO):思想就是先入先出隊列,效果差。
  • 最近最久未使用的置換演算法(LRU):近似最優置換演算法,最優置換演算法是通過「未來」的使用情況來推測要淘汰的頁面,而 LRU 則是通過「歷史」的使用情況來推測要淘汰的頁面。使用LRU就要維護一個LRU鏈表(後面這幾句都可以在MySQL的記憶體淘汰策略中有所體現),在每次訪問記憶體時都必須要更新「整個鏈表」。LRU 雖然看上去不錯,但是由於開銷比較大,實際應用中比較少使用。

MySQL用的是LRU,效果好,但是代價也是比較大的。

  • 時鐘頁面置換演算法(Lock):優化置換的次數,也能方便實現兩者兼得,它跟 LRU 近似,又是對 FIFO 的一種改進。

演算法思想為:把所有的頁面都保存在一個類似鐘面的「環形鏈表」中,一個表針指向最老的頁面。
當發生缺頁中斷時,演算法首先檢查表針指向的頁面:遇到1則變為0,然後繼續往下,知道遇到0就替換掉這個頁面。

感覺是相對於FIFO演算法,每個頁面多了一次的選擇機會。

  • 最不常用置換演算法(LFU):當發生缺頁中斷時,選擇「訪問次數」最少的那個頁面,並將其淘汰。(感覺演算法名字不太貼切)。具體實現:對每個頁面設置一個「訪問計數器」,每當一個頁面被訪問時,該頁面的訪問計數器就累加 1。在發生缺頁中斷時,淘汰計數器值最小的那個頁面。

要增加一個計數器來實現,這個硬體成本是比較高的,另外如果要對這個計數器查找哪個頁面訪問次數最小,查找鏈表本身,如果鏈表長度很大,是非常耗時的,效率不高。
但還有個問題,LFU 演算法只考慮了頻率問題,沒考慮時間的問題,比如有些頁面在過去時間里訪問的頻率很高,但是現在已經沒有訪問了,而當前頻繁訪問的頁面由於沒有這些頁面訪問的次數高,在發生缺頁中斷時,就會可能會誤傷當前剛開始頻繁訪問,但訪問次數還不高的頁面。
那這個問題的解決的辦法還是有的,可以定期減少訪問的次數,比如當發生時間中斷時,把過去時間訪問的頁面的訪問次數除以 2,也就說,隨著時間的流失,以前的高訪問次數的頁面會慢慢減少,相當於加大了被置換的概率。

Redis

參考:

Redis 記憶體淘汰策略共有八種,這八種策略大體分為「不進行數據淘汰」和「進行數據淘汰」兩類策略。
image.png
1、不進行數據淘汰的策略
noeviction(Redis3.0之後,預設的記憶體淘汰策略) :它表示當運行記憶體超過最大設置記憶體時,不淘汰任何數據,這時如果有新的數據寫入,則會觸發 OOM,但是如果沒用數據寫入的話,只是單純的查詢或者刪除操作的話,還是可以正常工作。
2、進行數據淘汰的策略
針對「進行數據淘汰」這一類策略,又可以細分為「在設置了過期時間的數據中進行淘汰」和「在所有數據範圍內進行淘汰」這兩類策略。
在設置了過期時間的數據中進行淘汰:

  • volatile-random:隨機淘汰設置了過期時間的任意鍵值;
  • volatile-ttl:優先淘汰更早過期的鍵值。
  • volatile-lru(Redis3.0 之前,預設的記憶體淘汰策略):淘汰所有設置了過期時間的鍵值中,最久未使用的鍵值;
  • volatile-lfu(Redis 4.0 後新增的記憶體淘汰策略):淘汰所有設置了過期時間的鍵值中,最少使用的鍵值;

在所有數據範圍內進行淘汰:

  • allkeys-random:隨機淘汰任意鍵值;
  • allkeys-lru:淘汰整個鍵值中最久未使用的鍵值;
  • allkeys-lfu(Redis 4.0 後新增的記憶體淘汰策略):淘汰整個鍵值中最少使用的鍵值

說白了就是LRULFU演算法。

Redis 是如何實現 LRU 演算法的?

簡單的LRU演算法存在什麼問題?

MySQL中考慮的是LRU演算法帶來的預讀失效和Buffer Pool污染的問題(簡單LRU演算法效果不好),而Redis是從LRU演算法維護成本來考慮的。

  • 需要用鏈表管理所有的緩存數據,這會帶來額外的空間開銷;
  • 當有數據被訪問時,需要在鏈表上把該數據移動到頭端,如果有大量數據被訪問,就會帶來很多鏈表移動操作,會很耗時,進而會降低 Redis 緩存性能。

Redis 實現的是一種近似 LRU 演算法,目的是為了更好的節約記憶體,它的實現方式是在 Redis 的對象結構體中添加一個額外的欄位,用於記錄此數據的最後一次訪問時間
當 Redis 進行記憶體淘汰時,會使用隨機採樣的方式來淘汰數據,它是隨機取 5 個值(此值可配置),然後淘汰最久沒有使用的那個

這樣實現就自然沒有了鏈表的開銷和移動鏈表節點的開銷了。但是多了一個額外欄位(記錄最後一次訪問時間)的開銷。

Redis 是如何實現 LFU 演算法的?

可以在上文中看到操作系統實現LFU演算法的問題有:1.加一個訪問計數器有硬體成本 2.雖叫LFU,但是只考慮了次數,而沒有考慮時間(頻率)。

在LFU演算法中,Redis實現相比於操作系統實現更好,真正的考慮了訪問頻率這個問題。
可以思考一下,為了考慮訪問頻率,我們至少需要哪些值。

  1. 當前的訪問頻率的值肯定是要記錄的。logc(Logistic Counter)
  2. 上一次的訪問時間,因為訪問時間間隔不同,訪問頻率的更新值就不同。ldt(Last Decrement Time)

在實現LRU演算法的時候,不是多了一個維護上一次訪問時間的欄位嗎?在LFU演算法中肯定不能浪費呀,也是重新用到了這個欄位。具體為:
在 LRU 演算法中,Redis 對象頭的 24 bits 的 lru 欄位是用來記錄 key 的訪問時間戳,因此在 LRU 模式下,Redis可以根據對象頭中的 lru 欄位記錄的值,來比較最後一次 key 的訪問時間長,從而淘汰最久未被使用的 key。
在 LFU 演算法中,Redis對象頭的 24 bits 的 lru 欄位被分成兩段來存儲,高 16bit 存儲 ldt(Last Decrement Time),低 8bit 存儲 logc(Logistic Counter)。
image.png

  • ldt 是用來記錄 key 的訪問時間戳;
  • logc 是用來記錄 key 的訪問頻次,它的值越小表示使用頻率越低,越容易淘汰,每個新加入的 key 的logc 初始值為 5。 ---註意是訪問評次,而不是簡單的訪問次數。

本文由博客一文多發平臺 OpenWrite 發佈!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 瞭解 console ● 什麼是 console ? console 其實是 JavaScript 內的一個原生對象 內部存儲的方法大部分都是在瀏覽器控制台輸出一些內容 並且還提供了很多的輔助方法 ● 最常見的 console 我們在開發 ...
  • 基於 Node.js、Express.js 和 MongoDB 通過Mongoose驅動進行 REST API 開發的輕量級樣板。集成了Swagger UI、JWT、session、發送郵箱驗證、日誌管理、統一的預定義狀態碼響應格式等,對於為前端平臺構建純凈的Web API非常有用。 ...
  • 前面已經介紹過CSS偽類的知識,具體可見前文 CSS偽類知識詳解。 偽元素常常被誤解為偽類,主要在於他們的語法相似,都是對於選擇器功能的擴展,相似程度很高導致被混淆。 本文通過詳細介紹偽元素和常見的使用方法,最後也會分析下偽元素與偽類的基本區別。 基本描述 CSS偽元素也是應用於選擇器的關鍵字,允許 ...
  • MVC模式(Model-View-Controller):是一種前端和後端都廣泛應用的設計模式。它將應用程式的業務邏輯、數據表示和用戶界面分離,使得開發人員可以獨立地修改各部分而不影響其他部分。MVC設計模式有助於提高代碼的可讀性、可維護性和可重用性。 MVC是Model-View-Controll ...
  • 如何為組件添加 CSS 的 class? 傳遞一個字元串作為 className 屬性: render() { return <span className="menu navigation-menu">Menu</span> } CSS 的 class 依賴組件的 props 或 state 的情 ...
  • 過濾器模式(Filter Pattern)或標準模式(Criteria Pattern),是一種結構型模式。這種模式允許使用不同的標準條件來過濾一組對象,並通過邏輯運算的方式把各條件連接起來,它結合多個標準來獲得單一標準。 例子將創建一個 Person 對象、Criteria 介面和實現了該介面的實... ...
  • 從我們作為業務開發主要的職責深入到DDD的本質是什麼?複雜度應處理?規範設計怎麼做?本文將全方位為大家解答。 ...
  • 入職多年,面對生產環境,儘管都是小心翼翼,慎之又慎,還是難免捅出簍子。輕則滿頭大汗,面紅耳赤。重則系統停擺,損失資金。每一個生產事故的背後,都是寶貴的經驗和教訓,都是項目成員的血淚史。為了更好地防範和遏制今後的各類事故,特開此專題,長期更新和記錄大大小小的各類事故。有些是親身經歷,有些是經人耳傳口授 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...