Redis AOF 持久化詳解

来源:https://www.cnblogs.com/remcarpediem/archive/2019/10/09/11644722.html
-Advertisement-
Play Games

AOF( append only file )持久化以獨立日誌的方式記錄每次寫命令,併在 Redis 重啟時在重新執行 AOF 文件中的命令以達到恢複數據的目的。AOF 的主要作用是解決數據持久化的實時性 ...


Redis 是一種記憶體資料庫,將數據保存在記憶體中,讀寫效率要比傳統的將數據保存在磁碟上的資料庫要快很多。但是一旦進程退出,Redis 的數據就會丟失。

為瞭解決這個問題,Redis 提供了 RDB 和 AOF 兩種持久化方案,將記憶體中的數據保存到磁碟中,避免數據丟失。RDB的介紹在這篇文章中《Redis RDB 持久化詳解》,今天我們來看一下 AOF 相關的原理。

AOF( append only file )持久化以獨立日誌的方式記錄每次寫命令,併在 Redis 重啟時在重新執行 AOF 文件中的命令以達到恢複數據的目的。AOF 的主要作用是解決數據持久化的實時性。

RDB 和 AOF

antirez 在《Redis 持久化解密》一文中講述了 RDB 和 AOF 各自的優缺點:

  • RDB 是一個緊湊壓縮的二進位文件,代表 Redis 在某個時間點上的數據備份。非常適合備份,全量複製等場景。比如每6小時執行 bgsave 備份,並把 RDB 文件拷貝到遠程機器或者文件系統中,用於災難恢復。
  • Redis 載入 RDB 恢複數據遠遠快於 AOF 的方式
  • RDB 方式數據沒辦法做到實時持久化,而 AOF 方式可以做到。

下麵,我們就來瞭解一下 AOF 是如何做到實時持久化的。

AOF 持久化的實現

示意圖

如上圖所示,AOF 持久化功能的實現可以分為命令追加( append )、文件寫入( write )、文件同步( sync )、文件重寫(rewrite)和重啟載入(load)。其流程如下:

  • 所有的寫命令會追加到 AOF 緩衝中。
  • AOF 緩衝區根據對應的策略向硬碟進行同步操作。
  • 隨著 AOF 文件越來越大,需要定期對 AOF 文件進行重寫,達到壓縮的目的。
  • 當 Redis 重啟時,可以載入 AOF 文件進行數據恢復。

命令追加

當 AOF 持久化功能處於打開狀態時,Redis 在執行完一個寫命令之後,會以協議格式(也就是RESP,即 Redis 客戶端和伺服器交互的通信協議 )將被執行的寫命令追加到 Redis 服務端維護的 AOF 緩衝區末尾。

比如說 SET mykey myvalue 這條命令就以如下格式記錄到 AOF 緩衝中。

  1. "*3\r\n$3\r\nSET\r\n$5\r\nmykey\r\n$7\r\nmyvalue\r\n"

Redis 協議格式本文不再贅述,AOF之所以直接採用文本協議格式,是因為所有寫入命令都要進行追加操作,直接採用協議格式,避免了二次處理開銷。

文件寫入和同步

Redis 每次結束一個事件迴圈之前,它都會調用 flushAppendOnlyFile 函數,判斷是否需要將 AOF 緩存區中的內容寫入和同步到 AOF 文件中。

flushAppendOnlyFile 函數的行為由 redis.conf 配置中的 appendfsync 選項的值來決定。該選項有三個可選值,分別是 alwayseverysecno

  • always:Redis 在每個事件迴圈都要將 AOF 緩衝區中的所有內容寫入到 AOF 文件,並且同步 AOF 文件,所以 always 的效率是 appendfsync 選項三個值當中最差的一個,但從安全性來說,也是最安全的。當發生故障停機時,AOF 持久化也只會丟失一個事件迴圈中所產生的命令數據。
  • everysec:Redis 在每個事件迴圈都要將 AOF 緩衝區中的所有內容寫入到 AOF 文件中,並且每隔一秒就要在子線程中對 AOF 文件進行一次同步。從效率上看,該模式足夠快。當發生故障停機時,只會丟失一秒鐘的命令數據。
  • no:Redis 在每一個事件迴圈都要將 AOF 緩衝區中的所有內容寫入到 AOF 文件。而 AOF 文件的同步由操作系統控制。這種模式下速度最快,但是同步的時間間隔較長,出現故障時可能會丟失較多數據。

Linux 系統下 write 操作會觸發延遲寫( delayed write )機制。Linux 在內核提供頁緩存區用來提供硬碟 IO 性能。 write 操作在寫入系統緩衝區之後直接返回。同步硬碟操作依賴於系統調度機制,例如:緩衝區頁空間寫滿或者達到特定時間周期。同步文件之前,如果此時系統故障宕機,緩衝區內數據將丟失。

fsync 針對單個文件操作,對其進行強制硬碟同步, fsync 將阻塞直到寫入磁碟完成後返回,保證了數據持久化。

appendfsync的三個值代表著三種不同的調用 fsync的策略。調用 fsync周期越頻繁,讀寫效率就越差,但是相應的安全性越高,發生宕機時丟失的數據越少。

有關 Linux 的I/O和各個系統調用的作用如下圖所示。具體內容可以查看《聊聊 Linux I/O》一文。

示意圖

AOF 數據恢復

AOF 文件裡邊包含了重建 Redis 數據所需的所有寫命令,所以 Redis 只要讀入並重新執行一遍 AOF 文件裡邊保存的寫命令,就可以還原 Redis 關閉之前的狀態。

示意圖

Redis 讀取 AOF 文件並且還原資料庫狀態的詳細步驟如下:

  • 創建一個不帶網路連接的的偽客戶端( fake client),因為 Redis 的命令只能在客戶端上下文中執行,而載入 AOF 文件時所使用的的命令直接來源於 AOF 文件而不是網路連接,所以伺服器使用了一個沒有網路連接的偽客戶端來執行 AOF 文件保存的寫命令,偽客戶端執行命令的效果和帶網路連接的客戶端執行命令的效果完全一樣的。
  • 從 AOF 文件中分析並取出一條寫命令。
  • 使用偽客戶端執行被讀出的寫命令。
  • 一直執行步驟 2 和步驟3,直到 AOF 文件中的所有寫命令都被處理完畢為止。

當完成以上步驟之後,AOF 文件所保存的資料庫狀態就會被完整還原出來。

AOF 重寫

因為 AOF 持久化是通過保存被執行的寫命令來記錄 Redis 狀態的,所以隨著 Redis 長時間運行,AOF 文件中的內容會越來越多,文件的體積也會越來越大,如果不加以控制的話,體積過大的 AOF 文件很可能對 Redis 甚至宿主電腦造成影響。

為瞭解決 AOF 文件體積膨脹的問題,Redis 提供了 AOF 文件重寫( rewrite) 功能。通過該功能,Redis 可以創建一個新的 AOF 文件來替代現有的 AOF 文件。新舊兩個 AOF 文件所保存的 Redis 狀態相同,但是新的 AOF 文件不會包含任何浪費空間的榮譽命令,所以新 AOF 文件的體積通常比舊 AOF 文件的體積要小得很多。

示意圖

如上圖所示,重寫前要記錄名為 list的鍵的狀態,AOF 文件要保存五條命令,而重寫後,則只需要保存一條命令。

AOF 文件重寫並不需要對現有的 AOF 文件進行任何讀取、分析或者寫入操作,而是通過讀取伺服器當前的資料庫狀態來實現的。首先從資料庫中讀取鍵現在的值,然後用一條命令去記錄鍵值對,代替之前記錄這個鍵值對的多條命令,這就是 AOF 重寫功能的實現原理。

在實際過程中,為了避免在執行命令時造成客戶端輸入緩衝區溢出,AOF 重寫在處理列表、哈希表、集合和有序集合這四種可能會帶有多個元素的鍵時,會先檢查鍵所包含的元素數量,如果數量超過 REDISAOFREWRITEITEMSPER_CMD ( 一般為64 )常量,則使用多條命令記錄該鍵的值,而不是一條命令。

rewrite的觸發機制主要有一下三個:

  • 手動調用 bgrewriteaof 命令,如果當前有正在運行的 rewrite 子進程,則本次rewrite 會推遲執行,否則,直接觸發一次 rewrite。
  • 通過配置指令手動開啟 AOF 功能,如果沒有 RDB 子進程的情況下,會觸發一次 rewrite,將當前資料庫中的數據寫入 rewrite 文件。
  • 在 Redis 定時器中,如果有需要退出執行的 rewrite 並且沒有正在運行的 RDB 或者 rewrite 子進程時,觸發一次或者 AOF 文件大小已經到達配置的 rewrite 條件也會自動觸發一次。

AOF 後臺重寫

AOF 重寫函數會進行大量的寫入操作,調用該函數的線程將被長時間阻塞,所以 Redis 在子進程中執行 AOF 重寫操作。

  • 子進程進行 AOF 重寫期間,Redis 進程可以繼續處理客戶端命令請求。
  • 子進程帶有父進程的記憶體數據拷貝副本,在不適用鎖的情況下,也可以保證數據的安全性。

但是,在子進程進行 AOF 重啟期間,Redis接收客戶端命令,會對現有資料庫狀態進行修改,從而導致數據當前狀態和 重寫後的 AOF 文件所保存的資料庫狀態不一致。

為此,Redis 設置了一個 AOF 重寫緩衝區,這個緩衝區在伺服器創建子進程之後開始使用,當 Redis 執行完一個寫命令之後,它會同時將這個寫命令發送給 AOF 緩衝區和 AOF 重寫緩衝區。

示意圖

當子進程完成 AOF 重寫工作之後,它會向父進程發送一個信號,父進程在接收到該信號之後,會調用一個信號處理函數,並執行以下工作:

  • 將 AOF 重寫緩衝區中的所有內容寫入到新的 AOF 文件中,保證新 AOF 文件保存的資料庫狀態和伺服器當前狀態一致。
  • 對新的 AOF 文件進行改名,原子地覆蓋現有 AOF 文件,完成新舊文件的替換
  • 繼續處理客戶端請求命令。

在整個 AOF 後臺重寫過程中,只有信號處理函數執行時會對 Redis 主進程造成阻塞,在其他時候,AOF 後臺重寫都不會阻塞主進程。

示意圖

後記

後續將會繼續學習 Redis 複製和集群相關的知識,希望大家持久關註。 

個人博客,歡迎來玩。地址


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 在cmd視窗輸入for /?後的原文,被我自己“翻譯”了一下,更像人話了。 推薦去https://www.cnblogs.com/cbugs/p/8992059.html這篇部落格裡去看看,講的更好。 在cmd視窗輸入for /?後 原文“翻譯” 對一組文件中的每一個文件執行某個特定命令。 基本格式 ...
  • 1.在活動目錄中新建一個用戶,並賦予域管理員許可權;2.拷貝conf目錄下的config.inc.php為config.inc.local.php;3.按自己的實際情況及要求修改config.inc.local.php文件中的相關參數,說明如下: ...
  • CEIWEI CommTone串口調試精靈 是一款功能強大的串列埠通信調試軟體,內嵌超過100種標準的CRC校驗功能,並支校驗結果高低位位元組前導轉換;支持批量協議調試,並支持文件、16進位、UNICODE字元串發送和顯示;支持無限迴圈發送、和次數迴圈發送數據;支持高精度的發送時間延時。使用Comm ...
  • "點我查看秘籍連載" 限制進程:內核態和用戶態 進程可分為兩種類型。一是操作系統自身運行時的內核類進程,也稱為 操作系統進程 。另一種即非內核類進程,不是操作系統自身的進程,而是想要實現某些功能,用戶自己去啟動的程式產生的進程,也稱為 用戶類進程或用戶進程 。 操作系統自身也是一個程式,它啟動之後也 ...
  • CEIWEI CommMonitor 串列埠監控精靈是用於 RS232 / RS422 / RS485 埠監控的專業 強大的系統實用程式軟體。CEIWEI CommMonitor 監控顯示,記錄和分析系統中的所有串列 埠活動。這是追蹤應用程式或驅動程式開發,串列設備測試和優化等過程中可能出現的 ...
  • 介紹 在上一篇使用完了環境變數,並且知道PATH環境變數概念,那麼我們對命令的執行就有了一定深入的理解。那麼PATH環境變數或其他環境變數是保存在哪呢?那麼這篇文章主要介紹環境變數配置文件。 配置文件 環境變數主要保存在以下四個文件和一個目錄中: 保存在 目錄下的配置文件,都是所有用戶通用的配置,就 ...
  • 前言 每當我們在生產環境伺服器上執行rm命令時,總是提心吊膽的,因為一不小心執行了誤刪,然後就要準備跑路了,畢竟人不是機器,更何況機器也有bug,呵呵。 那麼如果真的刪除了不該刪除的文件,比如資料庫、日誌或執行文件,咋辦呢?欲知後事如何,請仔細看完本篇博客。 模擬場景 1. 刪除 誤刪除伺服器目錄/ ...
  • Mysql 單表查詢 排序 分頁 group by初識 對於select 來說, 分組聚合(((group by; aggregation), 排序 ( order by ), 分頁查詢 ( limit ), 等這些操作, 都是結合 where 過濾(算術表達式, 邏輯表達式, 判空, 範圍過濾, ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...