為什麼Redis不直接使用C語言的字元串?看完直接弔打面試官!

来源:https://www.cnblogs.com/yidengjiagou/archive/2023/03/21/17239149.html
-Advertisement-
Play Games

眾所周知Redis有以下幾種常見的數據類型 String(字元串)、List(列表)、Set(集合)、Hash(哈希)、Sorted set(有序集合)、Stream(流)、Geo(地理空間索引)、Bitmap(點陣圖)、HyperLogLog(基數統計)等。 我們最常用的就是String(字元串)... ...


眾所周知Redis有以下幾種常見的數據類型 String(字元串)、List(列表)、Set(集合)、Hash(哈希)、Sorted set(有序集合)、Stream(流)、Geo(地理空間索引)、Bitmap(點陣圖)、HyperLogLog(基數統計)等。

我們最常用的就是String(字元串)類型,String類型既可以存儲字元串,也可以存儲數字,甚至可以直接進行數值運算。

redis> set key1 value1
OK

redis> get key1
"value1"

redis> set key 1
Ok 

redis> INCR key
(integer) 2

Redis是使用標準C語言編寫的,而Redis String類型底層使用SDS(Simple Dynamic String 簡單動態字元串),但是卻沒有使用C語言字元串使用,這到底是為什麼呢?

Redis的優點是快、安全、節省記憶體,在設計Redis String實現的時候,也深刻的體現了Redis的這三個優點。

提到Redis字元串的優點,需要先看一下C語言字元串的缺點,畢竟沒有對比就沒有傷害。

1. C語言字元串實現原理

C語言字元串是使用char數組存儲,以'\0'作為字元串結束,比如字元串”Redis“在C語言中存儲結構就是下麵這樣:

那麼這種存儲方式有什麼缺點呢?

1.1 不安全

C語言字元串這種特殊規定,就導致無法存儲特殊字元。如果某個字元串中間包含'\0'字元,讀取字元串的時候就無法讀取到完整字元,遇到'\0'就結束了,像下麵這樣,只能讀取到前半部分“Red”。

如果存儲到C語言的字元串,無法完整讀取,肯定是不安全的,所以C語言無法存儲包含特殊字元的字元串(例如二進位數據)。

1.2 查詢性能較低

如果想要獲取字元串的長度,需要遍歷整個字元串,時間複雜度是O(n),查詢效率較低。

1.3 存在緩存區溢出風險

開發中最常用的功能是拼接字元串,每次拼接字元串的時候,都要提前進行擴容。如果忘記擴容了,就會出現緩存區溢出。

1.4 擴容性能較差

擴容過程是非常耗時的,而且每次拼接字元串的時候都需要提交擴容。想象一下,如果使用HashMap的時候,每次put操作都需要進行擴容,性能將會差到什麼程度。

由於C語言字元串有這麼多缺點,而Redis又追求極致性能,所以只能自己實現一套,看一下Redis字元串底層是怎麼實現的?

2. SDS底層實現原理

Redis3.0版本之前的底層結構是這樣的:

struct sdshdr {
    // 記錄buf數組中已使用位元組的數量
    // 等於SDS所保存字元串的長度
    int len;

    // 記錄buf數組中未使用位元組的數量
    int free;

    // 位元組數組,用於保存字元串
    char buf[];
};

而最新Redis7.0版本,sds底層結構是這樣的,分成5個實現:

為什麼會有5種實現呢?

看一下每種實現的len和alloc的類型就明白了,sdshdr8裡面的類型是uint8_t,sdshdr16裡面的類型是uint16_t,sdshdr32裡面的類型是uint32_t,sdshdr64裡面的類型是uint64_t,用來存儲不同長度的字元串。使用合適的類型,可以節約大量記憶體。

Redis自己實現的字元串解決了C語言字元串遇到的問題,並且有以下幾個優點:

2.1 存儲安全

sds簡化版的存儲結構是這樣的:

struct sdshdr {
    // 已經使用的位元組數量
    int len;
    
    // char數組總位元組數量
    int alloc;
  
    // 位元組數組,用於保存字元串
    char buf[];
}; 

可以看出,Redis的字元串並不是用'\0'表示結尾,而是使用len記錄了字元串的長度。想要取出完整的字元串,只需要遍歷len長度即可。

2.2 查詢性能較高

Redis的字元串使用len記錄了字元串的長度,想要獲取整個字元串的長度,無需遍歷字元串,只需要查詢len值即可,時間複雜度是O(1)。

Redis採用空間換時間的做法,增加了存儲空間,加快了查詢性能。

2.3 避免緩存區溢出

Redis的字元串使用len記錄了字元串的長度,使用alloc記錄整個數組的長度,(alloc - len)表示未使用的空間長度。

如果新增的拼接字元串長度小於未使用空間,就不用擴容了。

2.4 擴容性能較好

Redis字元串還實現空間預分配和惰性空間釋放的優化策略,減少擴容次數。

簡單理解就是拼接字元串導致擴容的時候會多增加一些空閑空間,縮短字元串的時候並不立即釋放這些空閑空間。

我是「一燈架構」,如果本文對你有幫助,歡迎各位小伙伴點贊、評論和關註,感謝各位老鐵,我們下期見

image


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 上篇文章我們介紹了 .NET應用系統的國際化-基於Roslyn抽取詞條、更新代碼 系統國際化改造整體設計思路如下: 提供一個工具,識別前後端代碼中的中文,形成多語言詞條,按語言、界面、模塊統一管理多有的多語言詞條 提供一個翻譯服務,批量翻譯多語言詞條 提供一個詞條服務,支持後端代碼在運行時根據用戶登 ...
  • 20230321 1.進程和線程的區別 進程(Process)和線程(Thread)是操作系統中的兩個重要概念。 一個進程可以看作是一個正在運行的程式實例,它擁有自己的地址空間、記憶體、數據棧和其他系統資源。一個進程可以包含多個線程,每個線程都是進程中獨立的執行流,每個線程共用進程的地址空間和系統資源 ...
  • 一、項目代碼 #vim /usr/local/src/mail_api_flask/run.py """ mail_api_flask 為基於Flask web框架開發的線上發送郵件api,實現功能復用。支持html模板郵件。 """ from flask import Flask from fla ...
  • Linux 中的 Bash 腳本支持對變數的操作,下麵鹹魚將介紹 Linux Bash Shell 中關於變數的 5 個易錯點 因為編程習慣,這類現象往往發生在大多數使用過其他流行編程語言的程式員身上 變數賦值 對於許多編程語言(例如 Python),變數賦值的時候在等號兩邊添加空格是一個好的習慣 ...
  • MySQL基礎:函數 函數是指一段可以直接被另一段程式調用的程式或代碼。 字元串函數 MySQL中內置了很多字元串函數,常用的幾個如下: | 函數 | 功能 | | : : | : : | | CONCAT(S1,S2,...Sn) | 字元串拼接,將S1,S2,...Sn拼接成一個字元串 | | ...
  • SQL:DML、DQL、DCL DML:Data Manipulation Language(數據操作語言) DML用來對資料庫中的數據記錄進行增刪改操作。 DML-添加數據 給指定欄位添加數據(一條數據) INSERT INTO 表名(欄位名1,欄位名2,...) VALUES(值1,值2,... ...
  • 摘要:本文就針對因USING子句的書寫方式可能導致MERGE INTO語句的執行不下推的場景,對USING子句的SQL語句進行改寫一遍,整個SQL語句可以下推。 本文分享自華為雲社區《GaussDB(DWS)運維 -- values子句做MERGE數據源導致SQL執行不下推的改寫方案》,作者: 譡里 ...
  • 什麼是主數據? 主數據是一組用於提供有關業務數據(如位置、客戶、產品、資產等)情境的標識符。它是企業或單位內運行業務必不可少的核心數據。否則,將無法統一比較系統之間的數據。但是,並非所有主數據都是一樣的。被指定為主數據的數據類型可能因行業而異。即使在同一行業的不同業務實體中,主數據的示例也可能是離散 ...
一周排行
    -Advertisement-
    Play Games
  • 概述:在C#中,++i和i++都是自增運算符,其中++i先增加值再返回,而i++先返回值再增加。應用場景根據需求選擇,首碼適合先增後用,尾碼適合先用後增。詳細示例提供清晰的代碼演示這兩者的操作時機和實際應用。 在C#中,++i 和 i++ 都是自增運算符,但它們在操作上有細微的差異,主要體現在操作的 ...
  • 上次發佈了:Taurus.MVC 性能壓力測試(ap 壓測 和 linux 下wrk 壓測):.NET Core 版本,今天計劃準備壓測一下 .NET 版本,來測試並記錄一下 Taurus.MVC 框架在 .NET 版本的性能,以便後續持續優化改進。 為了方便對比,本文章的電腦環境和測試思路,儘量和... ...
  • .NET WebAPI作為一種構建RESTful服務的強大工具,為開發者提供了便捷的方式來定義、處理HTTP請求並返迴響應。在設計API介面時,正確地接收和解析客戶端發送的數據至關重要。.NET WebAPI提供了一系列特性,如[FromRoute]、[FromQuery]和[FromBody],用 ...
  • 原因:我之所以想做這個項目,是因為在之前查找關於C#/WPF相關資料時,我發現講解圖像濾鏡的資源非常稀缺。此外,我註意到許多現有的開源庫主要基於CPU進行圖像渲染。這種方式在處理大量圖像時,會導致CPU的渲染負擔過重。因此,我將在下文中介紹如何通過GPU渲染來有效實現圖像的各種濾鏡效果。 生成的效果 ...
  • 引言 上一章我們介紹了在xUnit單元測試中用xUnit.DependencyInject來使用依賴註入,上一章我們的Sample.Repository倉儲層有一個批量註入的介面沒有做單元測試,今天用這個示例來演示一下如何用Bogus創建模擬數據 ,和 EFCore 的種子數據生成 Bogus 的優 ...
  • 一、前言 在自己的項目中,涉及到實時心率曲線的繪製,項目上的曲線繪製,一般很難找到能直接用的第三方庫,而且有些還是定製化的功能,所以還是自己繪製比較方便。很多人一聽到自己畫就害怕,感覺很難,今天就分享一個完整的實時心率數據繪製心率曲線圖的例子;之前的博客也分享給DrawingVisual繪製曲線的方 ...
  • 如果你在自定義的 Main 方法中直接使用 App 類並啟動應用程式,但發現 App.xaml 中定義的資源沒有被正確載入,那麼問題可能在於如何正確配置 App.xaml 與你的 App 類的交互。 確保 App.xaml 文件中的 x:Class 屬性正確指向你的 App 類。這樣,當你創建 Ap ...
  • 一:背景 1. 講故事 上個月有個朋友在微信上找到我,說他們的軟體在客戶那邊隔幾天就要崩潰一次,一直都沒有找到原因,讓我幫忙看下怎麼回事,確實工控類的軟體環境複雜難搞,朋友手上有一個崩潰的dump,剛好丟給我來分析一下。 二:WinDbg分析 1. 程式為什麼會崩潰 windbg 有一個厲害之處在於 ...
  • 前言 .NET生態中有許多依賴註入容器。在大多數情況下,微軟提供的內置容器在易用性和性能方面都非常優秀。外加ASP.NET Core預設使用內置容器,使用很方便。 但是筆者在使用中一直有一個頭疼的問題:服務工廠無法提供請求的服務類型相關的信息。這在一般情況下並沒有影響,但是內置容器支持註冊開放泛型服 ...
  • 一、前言 在項目開發過程中,DataGrid是經常使用到的一個數據展示控制項,而通常表格的最後一列是作為操作列存在,比如會有編輯、刪除等功能按鈕。但WPF的原始DataGrid中,預設只支持固定左側列,這跟大家習慣性操作列放最後不符,今天就來介紹一種簡單的方式實現固定右側列。(這裡的實現方式參考的大佬 ...