其實,Redis 的每種對象都有對象結構與對應編碼的數據結構組合而成,進階 Redis 就需要從它的對象機制開始。 ...
簡介
Redis 使用對象存儲資料庫中的鍵和值,每當在 Redis 中創建一個新的鍵值對時,都會創建兩個對象:一個是鍵對象,另一個是值對象。
其中,Redis 的每種對象都由對象結構和對應編碼的數據結構組合而成,而每種對象類型對應若幹編碼方式,不同編碼方式對應的底層數據結構也會有所不同。
資料庫結構
Redis 伺服器的資料庫都保存在 redisServer
的 db
數組中,數組中的每個項都是 redisDb
結構,每個 redisDb
結構代表一個資料庫。
下麵是部分 redisServer
結構:
struct redisServer {
redisDb *db; // 保存資料庫的數組
int dbnum; // 伺服器的資料庫數量
// ...
};
其中,初始化伺服器時,會根據 dbnum
的值決定創建多少個資料庫。預設情況下,dbnum
的值是 16。
切換資料庫
預設情況下,Redis 客戶端的目標資料庫是 0 號資料庫,但是客戶端可以使用 SELECT
命令切換目標資料庫。
需要註意的是,Redis 現在沒有向客戶端返回目標資料庫的命令,對資料庫進行誤操作極易出現不符合預期的情況,尤其是像 FLUSHDB
這樣的命令。
比較好的做法是儘量少地在代碼中切換資料庫,即使是在命令行操作,也儘量顯式地切換到指定的資料庫,然後再執行命令。
資料庫鍵空間
每一個資料庫中都存儲了一個字典,這個字典存儲了資料庫中的所有鍵值對,這個字典又被稱為鍵空間。
所有對資料庫中鍵值對的增刪查改操作,實際上都是在操作鍵空間字典。
只是,由於資料庫可以存儲多種不同的數據結構類型,這些增刪查改操作,都會使用對應數據結構提供的函數執行。
讀寫鍵空間的維護操作
當使用 Redis 命令對鍵空間字典進行讀寫操作時,伺服器不僅會執行這些讀寫操作,還會做一些維護性的操作,提高 Redis 的可用性,其中包括:
- 讀取一個鍵時,伺服器會根據鍵是否存在來更新鍵空間命中次數和不命中次數
- 讀取到一個鍵之後,伺服器會更新這個鍵的
lru
屬性 - 如果伺服器讀取到鍵之後,發現這個鍵已經過期,會先刪除這個鍵,再執行後續的操作
- 如果有客戶端使用
WATCH
命令監視這個鍵,伺服器修改這個鍵之後,會將這個鍵標記為 dirty 狀態 - 伺服器每次修改一個鍵之後,都會對臟計數器的值增 1,這個計數器會觸發伺服器的持久化或複製操作
- 如果伺服器開啟了通知功能,那麼對這個鍵做修改操作之後,伺服器將按配置發送對應的資料庫通知
類型與編碼
Redis 中的每個對象都是由一個 redisObject
結構表示,其結構如下:
typedef struct redisObject {
unsigned type:4; // 類型
unsigned encoding:4; // 編碼
unsigned lru:LRU_BITS; // 記錄最後訪問的時間
int refcount; // 引用計數
void *ptr; // 指向底層實現數據結構的指針
} robj;
其中 type
、encoding
和 ptr
是最重要的三個屬性。
數據類型
對象的 type
屬性記錄了數據結構的類型,它總是以下枚舉值之一:
REDIS_STRING
REDIS_LIST
REDIS_HASH
REDIS_SET
REDIS_ZSET
對象編碼
對象的 encoding
屬性記錄了 ptr
指針指向對象的編碼方式,它總是以下枚舉值之一:
OBJ_ENCODING_RAW
OBJ_ENCODING_INT
OBJ_ENCODING_HT
OBJ_ENCODING_ZIPMAP
OBJ_ENCODING_LINKEDLIST
OBJ_ENCODING_ZIPLIST
OBJ_ENCODING_INTSET
OBJ_ENCODING_SKIPLIST
OBJ_ENCODING_EMBSTR
OBJ_ENCODING_QUICKLIST
OBJ_ENCODING_STREAM
通過使用 encoding
屬性設定對象的編碼方式,而不是使用固定編碼,這樣極大地提高了 Redis 的靈活性和效率,也方便 Redis 針對不同的場景選擇不同的編碼,針對性地做優化。
對象指針
對象的 ptr
屬性是一個指針,指向實際保存值的數據結構。
空轉時間
對象的 lru
屬性記錄了對象最後一次被命令程式訪問的時間。空轉時間指的是當前時間減去 lru
屬性得到的時長,即未被訪問的時長。
鍵的空轉時間在記憶體回收演算法是 volatile-lru
或 allkeys-lru
時使用到,當伺服器占用的記憶體超過了 maxmemory
之後,空轉時長較高的那部分鍵會優先被伺服器釋放,從而回收記憶體。
命令執行流程
Redis 中用於操作鍵的命令分為兩類:任何類型的鍵都可以執行的命令、針對特定類型的鍵可執行的命令。例如 DEL
、EXPIRE
等命令屬於前者,SET
、HSET
等命令屬於後者。
針對特定類型的鍵的執行命令,執行前需要檢查鍵的類型,確定當前鍵是否可執行當前命令。
在 Redis 中,一個數據類型有可能對應多個編碼方式,在檢查完鍵的類型之後,還需要根據數據類型的不同編碼進行多態處理。
因此,當處理一個特定類型命令的時候,執行的步驟如下:
- 根據給定的 key 名稱,在資料庫字典中查找相對應的 Redis 對象,如果沒有找到,返回
NULL
值 - 檢查 Redis 對象中的
type
屬性和執行命令所需的類型是否相符,如果不相符,返回類型錯誤 - 根據 Redis 對象中的
encoding
屬性選擇合適的操作函數來處理底層數據結構 - 將操作函數的返回值作為命令請求的響應返回給客戶端
對象共用
目前,為瞭解決重覆分配的麻煩,Redis 會在初始化伺服器時創建一萬個字元串對象,這些對象包含了從 0 到 9999 的所有整數值,當伺服器需要用到值為 0 到 9999 的字元串對象時,伺服器就會使用這些共用對象,而不是創建新的對象。
儘管共用更複雜的對象可以節約更多的記憶體,但受到 CPU 時間的限制,Redis 只對包含整數值的字元串對象進行共用。
需要註意的是,共用對象只能被字典和雙向鏈表這類能帶有指針的數據結構使用。
記憶體回收
因為 C 語言並不具備自動記憶體回收功能,所以 Redis 在自己的對象系統中構建了一個引用計數技術實現記憶體回收機制。通過這個記憶體回收機制,Redis 可以通過對象的引用計數信息,在適當的時候自動釋放對象併進行記憶體回收。
對象的引用計數信息通過 refcount
屬性記錄,其使用如下:
- 當創建新對象時,引用計數的值會初始化為
1
- 當這個對象被共用時,引用計數的值會自增
- 當使用完一個對象後,或者消除對這個對象的引用之後,引用計數的值會自減
- 當對象的引用計數值變為
0
時,對象所占用的記憶體會被釋放