眾所周知Redis有以下幾種常見的數據類型 String(字元串)、List(列表)、Set(集合)、Hash(哈希)、Sorted set(有序集合)、Stream(流)、Geo(地理空間索引)、Bitmap(點陣圖)、HyperLogLog(基數統計)等。 我們最常用的就是String(字元串)... ...
眾所周知Redis有以下幾種常見的數據類型 String(字元串)、List(列表)、Set(集合)、Hash(哈希)、Sorted set(有序集合)、Stream(流)、Geo(地理空間索引)、Bitmap(點陣圖)、HyperLogLog(基數統計)等。
我們最常用的就是String(字元串)類型,String類型既可以存儲字元串,也可以存儲數字,甚至可以直接進行數值運算。
redis> set key1 value1
OK
redis> get key1
"value1"
redis> set key 1
Ok
redis> INCR key
(integer) 2
Redis是使用標準C語言編寫的,而Redis String類型底層使用SDS(Simple Dynamic String 簡單動態字元串),但是卻沒有使用C語言字元串使用,這到底是為什麼呢?
Redis的優點是快、安全、節省記憶體,在設計Redis String實現的時候,也深刻的體現了Redis的這三個優點。
提到Redis字元串的優點,需要先看一下C語言字元串的缺點,畢竟沒有對比就沒有傷害。
1. C語言字元串實現原理
C語言字元串是使用char數組存儲,以'\0'作為字元串結束,比如字元串”Redis“在C語言中存儲結構就是下麵這樣:
那麼這種存儲方式有什麼缺點呢?
1.1 不安全
C語言字元串這種特殊規定,就導致無法存儲特殊字元。如果某個字元串中間包含'\0'字元,讀取字元串的時候就無法讀取到完整字元,遇到'\0'就結束了,像下麵這樣,只能讀取到前半部分“Red”。
如果存儲到C語言的字元串,無法完整讀取,肯定是不安全的,所以C語言無法存儲包含特殊字元的字元串(例如二進位數據)。
1.2 查詢性能較低
如果想要獲取字元串的長度,需要遍歷整個字元串,時間複雜度是O(n),查詢效率較低。
1.3 存在緩存區溢出風險
開發中最常用的功能是拼接字元串,每次拼接字元串的時候,都要提前進行擴容。如果忘記擴容了,就會出現緩存區溢出。
1.4 擴容性能較差
擴容過程是非常耗時的,而且每次拼接字元串的時候都需要提交擴容。想象一下,如果使用HashMap的時候,每次put操作都需要進行擴容,性能將會差到什麼程度。
由於C語言字元串有這麼多缺點,而Redis又追求極致性能,所以只能自己實現一套,看一下Redis字元串底層是怎麼實現的?
2. SDS底層實現原理
Redis3.0版本之前的底層結構是這樣的:
struct sdshdr {
// 記錄buf數組中已使用位元組的數量
// 等於SDS所保存字元串的長度
int len;
// 記錄buf數組中未使用位元組的數量
int free;
// 位元組數組,用於保存字元串
char buf[];
};
而最新Redis7.0版本,sds底層結構是這樣的,分成5個實現:
為什麼會有5種實現呢?
看一下每種實現的len和alloc的類型就明白了,sdshdr8裡面的類型是uint8_t,sdshdr16裡面的類型是uint16_t,sdshdr32裡面的類型是uint32_t,sdshdr64裡面的類型是uint64_t,用來存儲不同長度的字元串。使用合適的類型,可以節約大量記憶體。
Redis自己實現的字元串解決了C語言字元串遇到的問題,並且有以下幾個優點:
2.1 存儲安全
sds簡化版的存儲結構是這樣的:
struct sdshdr {
// 已經使用的位元組數量
int len;
// char數組總位元組數量
int alloc;
// 位元組數組,用於保存字元串
char buf[];
};
可以看出,Redis的字元串並不是用'\0'表示結尾,而是使用len記錄了字元串的長度。想要取出完整的字元串,只需要遍歷len長度即可。
2.2 查詢性能較高
Redis的字元串使用len記錄了字元串的長度,想要獲取整個字元串的長度,無需遍歷字元串,只需要查詢len值即可,時間複雜度是O(1)。
Redis採用空間換時間的做法,增加了存儲空間,加快了查詢性能。
2.3 避免緩存區溢出
Redis的字元串使用len記錄了字元串的長度,使用alloc記錄整個數組的長度,(alloc - len)表示未使用的空間長度。
如果新增的拼接字元串長度小於未使用空間,就不用擴容了。
2.4 擴容性能較好
Redis字元串還實現空間預分配和惰性空間釋放的優化策略,減少擴容次數。
簡單理解就是拼接字元串導致擴容的時候會多增加一些空閑空間,縮短字元串的時候並不立即釋放這些空閑空間。
我是「一燈架構」,如果本文對你有幫助,歡迎各位小伙伴點贊、評論和關註,感謝各位老鐵,我們下期見