Redis提供更加豐富的數據結構,如:字元串、列表、集合、有序集合、哈希、點陣圖、HyperLogLogs,你都真正瞭解嘛? ...
前言
Redis不是一個簡單的鍵值對存儲,它實際上是一個支持各種類型數據結構的存儲。在傳統的鍵值存儲中,是將字元串鍵關聯到字元串值,但是在Redis中,這些值不僅限於簡單的字元串,還可以支持更複雜的數據結構。下麵就是Redis支持的數據結構:
- 字元串(String):二進位安全字元串。
- 列表(List):根據插入順序排序的字元串元素列表,基於鏈表實現。
- 集合(Set):唯一的亂序的字元串元素的集合。
- 有序集合(Sorted Set):與集合類似,但是每個字元串元素都與一個稱為score的數字相關聯。 元素總是按其score排序,並且可以檢索一定score範圍的元素。
- 哈希(Hash):由欄位與值相關聯組成的映射,欄位和值都是字元串。
- 點陣圖(Bitmap):像操作位數組一樣操作字元串值,可以設置和清除某個位,對所有為1的位進行計數,找到第一個設置1的位,找到第一個設置0的位等等。
- HyperLogLogs:一種概率數據結構,使用較小的記憶體空間來統計唯一元素的數量,誤差小於1%。
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
鍵(Key)
鍵
是二進位安全的,這意味著您可以使用任何二進位序列作為鍵,可以是OneMoreStudy
這樣的字元串,也可以使圖片文件的內容,空字元串也是有效的鍵
。不過,還有一些其他規則:
- 不要使用過長的
鍵
,比如一個1KB的鍵。不僅是多占記憶體方面的問題,而是在數據集中查找鍵
可能需要進行一些耗時的鍵
比較。如果真的有比較大的鍵
,先對它進行哈希(比如:MD5
、SHA1
)是一個好主意。 - 也不要使用過短的
鍵
,比如:OMS100f
,相對於one-more-study:100:fans
,後者更具有可讀性。可能會占用更多記憶體,但是相對於值所占的記憶體,鍵
所增加的記憶體還是小很多的。我們要找到一個平衡點,不長也不短。 - 多個欄位以冒號分隔,一個欄位內多個單詞以連詞符或點分隔,比如:
one-more-study:100:fans
,或者one.more.study:100:fans
。 鍵
允許的最大值為512MB。
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
字元串(String)
字元串類型是和鍵
關聯的最簡單的類型。它是Memcached中唯一的數據類型,因此對於新手來說,在Redis中使用它也是很容易的。鍵
是字元串類型,當我們也使用字元串類型作為值時,我們會可以從一個字元串映射到另一個字元串。 字元串數據類型有很多應用場景,例如緩存HTML片段或頁面。
下麵簡單介紹一下字元串的命令(在redis-cli中使用):
> set one-more-key OneMoreStudy
OK
> get one-more-key
"OneMoreStudy"
使用SET
和GET
命令來設置和查詢字元串值的方式。需要註意的是,如果當前鍵
已經和字元串值相關聯,SET
命令將會替換已存儲在鍵
中的現有值。字元串可以是任意的二進位數據,比如jpeg圖像。字元串最多不能大於512MB。SET
命令還有一些實用的可選參數,比如:
> set one-more-key Java nx #如果key存在,則設置失敗。
(nil)
> set one-more-key Java xx #如果key存在,才設置成功。
OK
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
雖然字元串是Redis的基本值,但也可以使用它們執行一些實用的操作。 比如:
> set one-more-counter 50
OK
> incr one-more-counter #自增加1
(integer) 51
> incr one-more-counter #自增加1
(integer) 52
> incrby one-more-counter 5 #自增加5
(integer) 57
INCR
命令將字元串值解析為整數,將其自增加1,最後將獲得的值設置為新值。 還有其他類似的命令,例如INCRBY
,DECR
和DECRBY
等命令。 INCR
命令是原子操作,即時有多個客戶端同時同一個key的INCR
命令,也不會進入競態條件。比如,上面的例子先設置one-more-counter
的值為50,即使兩個客戶端同時發出INCR命令,那麼最後的值也肯定是52。
可以使用MSET
和MGET
命令在單個命令中設置或查詢多個鍵
的值,對於減少延遲也很有用。比如:
> mset a 1 b 2 c 3
OK
> mget a b c
1) "1"
2) "2"
3) "3"
使用MGET
命令時,Redis返回一個值的數組。
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
使用DEL命令可以刪除鍵
和相關聯的值,存在指定的鍵
則返回1,不存在指定的鍵
則返回0。使用EXISTS
命令判斷Redis中是否存在指定的鍵
,存在指定的鍵
則返回1,不存在指定的鍵
則返回0。比如:
> set one-more-key OneMoreStudy
OK
> exists one-more-key
(integer) 1
> del one-more-key
(integer) 1
> exists one-more-key
(integer) 0
使用TYPE
命令,可以返回存儲在指定key的值的數據類型,比如:
> set one-more-key OneMoreStudy
OK
> type one-more-key
string
> del one-more-key
(integer) 1
> type one-more-key
none
在討論更複雜的數據結構之前,我們需要討論另一個功能,該功能無論值類型是什麼都適用,它就是EXPIRE
命令。 它可以為鍵
設置到期時間,當超過這個到期時間後,該鍵
將自動銷毀,就像對這個鍵
調用了DEL
命令一樣。比如:
> set one-more-key OneMoreStudy
OK
> expire one-more-key 5
(integer) 1
> get one-more-key #立刻調用
"OneMoreStudy"
> get one-more-key #5秒鐘後調用
(nil)
上面的例子,適用了EXPIRE
命令設置了過期時間,也可以使用PERSIST
命令移除鍵
的過期時間,這個鍵
將持久保持。除了EXPIRE
命令,還可以使用SET命令設置過期時間,比如:
> set one-more-key OneMoreStudy ex 10 #設置過期時間為10秒
OK
> ttl one-more-key
(integer) 9
上面的例子,設置了一個字元串值OneMoreStudy
的one-more-key
,該鍵
的到期時間為10秒。之後,調用TTL
命令以檢查該鍵
的剩餘生存時間。
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
到期時間可以使用秒或毫秒精度進行設置,但到期時間的解析度始終為1毫秒。實際上,Redis伺服器上存儲的不是到期時間長度,而是該鍵
到期的時間。
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
列表(List)
Redis列表是使用鏈表實現的,這就意味著在頭部或尾部增加或刪除一個的元素的時間複雜度是O(1),非常快的。不過,按索引查詢對應元素的時間複雜度就是O(n),慢很多。如果想快速查詢大量數據,可以使用有序集合,後面會有介紹。
LPUSH
命令將一個新元素添加到列表的左側(頂部),而RPUSH
命令將一個新元素添加到列表的右側(底部)。最後,LRANGE
命令可以從列表中按範圍提取元素。比如:
> rpush one-more-list A
(integer) 1
> rpush one-more-list B
(integer) 2
> lpush one-more-list first
(integer) 3
> lrange one-more-list 0 -1
1) "first"
2) "A"
3) "B"
LRANGE
命令需要另外兩個參數,要返回的第一個元素的索引和最後一個元素的索引。如果索引為負值,Redis將從末尾開始計數,-1是列表的最後一個元素,-2是列表的倒數第二個元素,依此類推。
LPUSH
和RPUSH
命令支持多個參數,可以使用一次命令添加多個元素,比如:
> rpush one-more-list 1 2 3 4 5 "last"
(integer) 9
> lrange one-more-list 0 -1
1) "first"
2) "A"
3) "B"
4) "1"
5) "2"
6) "3"
7) "4"
8) "5"
9) "last"
在Redis列表上,也可以移除並返回元素。 與LPUSH
和RPUSH
命令,對應的就是LPOP
和RPOP
命令,LPOP
命令是將列表的左側(頂部)的元素移除並返回,RPOP
命令是將列表的右側(底部)的元素移除並返回。比如:
> rpush one-more-list a b c
(integer) 3
> rpop one-more-list
"c"
> rpop one-more-list
"b"
> rpop one-more-list
"a"
我們添加了三個元素,並移除並返回了三個元素,此時列表為空,沒有任何元素。如果再使用RPOP
命令,會返回一個NULL
值:
> rpop one-more-list
(nil)
使用RPUSH
和RPOP
命令,或者LPUSH
和LPOP
命令可以實現棧的功能,使用LPUSH
和RPOP
命令,或者RPUSH
和LPOP
命令可以實現隊列的功能。也可以實現生產者和消費者模式,比如多個生產者使用LPUSH
命令將任務添加到列表中,多個消費者使用RPOP
命令將任務從列表中取出。但是,有時列表可能為空,沒有任何要處理的任務,因此RPOP
命令僅返回NULL
。在這種情況下,消費者被迫等待一段時間,然後使用RPOP
命令重試。這就暴露了有幾個缺點:
- 客戶端和服務端之間可以處理無用的命令,因為在列表為空時的所有請求將無法完成任何實際工作,它們只會返回
NULL
。 - 由於消費者在收到
NULL
之後會等待一段時間,因此會增加任務處理的延遲。為了減小延遲,我們可以在兩次調用RPOP
之間等待更少的時間,這就擴大了更多對Redis的無用調用。
有什麼辦法可以解決呢?使用BRPOP
和BLPOP
的命令,它們和RPOP
和LPOP
命令類似,唯一的區別是:如果列表為空時,命令會被阻塞,直到有新元素添加到列表中,或指定的超時時間到了時,它們才會返回到調用方。比如:
> brpop tasks 5
它含義是,列表為空時,等待列表中的元素,但如果5秒鐘後沒有新的元素被添加,則返回。您可以將超時時間傳入0,表示永遠等待元素添加。也可以傳入多個列表,這時會按參數先後順序依次檢查各個列表,返回第一個非空列表的尾部元素。另外還有以下3點需要註意的:
- 當列表為空,並且有多個客戶端在等待時,有一個新的元素被添加到列表中,它會被第一個等待的客戶端獲取到,以此類推。
- 返回值與
RPOP
命令相比有所不同,它是一個包含兩個元素的數組,包含key和對應的元素,因為BRPOP
和BLPOP
命令能夠阻止等待來自多個列表的元素。 - 超過了超時時間,會返回
NULL
。
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
列表的創建和刪除都是由Redis自動完成的,當嘗試向不存在的鍵
添加元素時,Redis會自動創建一個空的列表;當最後一個元素被移除時,Redis會自動刪除這個列表。這不是特定於列表的,它適用於由多個元素組成的所有Redis數據類型,比如集合、有序集合、哈希,它們都有3條規則:
- 當我們將元素添加到聚合數據類型時,如果目標
鍵
不存在,則在添加元素之前會創建一個空的聚合數據類型。比如:
> del one-more-list
(integer) 1
> lpush one-more-list 1 2 3
(integer) 3
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
但是,在鍵
存在時,就不能操作錯誤的數據類型了,比如:
> set one-more-key OneMoreStudy
OK
> lpush one-more-key 1 2 3
(error) WRONGTYPE Operation against a key holding the wrong kind of value
> type one-more-key
string
- 當我們從聚合數據類型中刪除元素時,如果該值保持為空,則key將自動銷毀。比如:
> lpush one-more-list 1 2 3
(integer) 3
> exists one-more-list
(integer) 1
> lpop one-more-list
"3"
> lpop one-more-list
"2"
> lpop one-more-list
"1"
> exists one-more-list
(integer) 0
- 當對應key不存在,並且調用只讀命令(如
LLEN
命令,獲取列表長度)或寫命令(如LPOP
命令)時,都會返回空聚合數據類型的結果。比如:
> del one-more-list
(integer) 0
> llen one-more-list
(integer) 0
> lpop one-more-list
(nil)
Redis為了追求高性能,列表的內部實現不是一個簡單的鏈表,這裡先賣個關子,後續的文章會詳細介紹。
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
集合(Set)
集合是一個字元串的無序集合,SADD
命令可以將新元素添加到集合中。還可以對集合進行許多其他操作,例如:判斷給定元素是否已存在、執行多個集合之間的交集、並集或差等等。比如:
> sadd one-more-set 1 2 3
(integer) 3
> smembers one-more-set
1) "1"
2) "3"
3) "2"
在上面的例子中,在集合中添加了三個元素,並讓Redis返回所有元素。 正如你所見,返回的元素是沒有排序的。在每次調用時,元素的順序都有可能不一樣。
還可以使用SISMEMBER
命令判斷給定元素是否已存在,比如:
> sismember one-more-set 3
(integer) 1
> sismember one-more-set 30
(integer) 0
在上面的例子中,3在集合中,所以返回1;而30不在集合中,所以返回0。
可以使用SINTER
命令,計算出多個集合的交集;使用SUNION
命令,計算多個集合的並集;使用SPOP
命令,移除並返回集合中的一個隨機元素;使用SCARD
命令,計算集合中的元素的數量。比如:
> sadd one-more-set1 1 2 3
(integer) 3
> sadd one-more-set2 2 3 4
(integer) 3
> sinter one-more-set1 one-more-set2 #交集
1) "3"
2) "2"
> sunion one-more-set1 one-more-set2 #並集
1) "1"
2) "3"
3) "2"
4) "4"
> spop one-more-set1 #隨機移除一個元素
"3"
> scard one-more-set1 #元素數量
(integer) 2
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
有序集合(Sorted Set)
有序集合是一種類似於集合和哈希之間混合的數據類型。像集合一樣,有序集合中由唯一的、非重覆的字元串元素組成,因此從某種意義上說,有序集合也是一個集合。但是集合中的元素是沒有排序的,而有序集合中的每個元素都與一個稱為分數
(score)的浮點值相關聯,這就是為什麼有序集合也類似於哈希的原因,因為每個元素都映射到一個值。有序集合的排序規則如下:
- 如果A和B是兩個具有不同分數的元素,那麼如果A.分數>B.分數,則A>B。
- 如果A和B的分數完全相同,那麼如果A字元串在字典排序上大於B字元串,則A>B。 A和B字元串不能相等,因為有序集合中的元素都是唯一的。
我們來舉個例子,把王者榮耀戰隊的名字和積分添加到有序集合中,其中把戰隊的名字作為值,把戰隊的積分作為分數。
> zadd kpl 12 "eStarPro"
(integer) 1
> zadd kpl 12 "QGhappy"
(integer) 1
> zadd kpl 10 "XQ"
(integer) 1
> zadd kpl 8 "EDG.M"
(integer) 1
> zadd kpl 8 "RNG.M"
(integer) 1
> zadd kpl 4 "TES"
(integer) 1
> zadd kpl 2 "VG"
(integer) 1
如上所示,ZADD
命令和SADD
命令相似,但是多了一個額外的參數(在要添加的元素的前面)作為分數。ZADD
命令也支持多個參數,雖然在上面的例子中未使用它,但你也可以指定多個分數和值對。使用有序集合,快速地返回按其積分排序的戰隊列表,因為實際上它們已經被排序了。
需要註意的是,為了快速獲取有序集合中的元素,每次添加元素的時間複雜度都為O(log(N)),這是因為有序集合是同時使用跳躍表和字典來實現的,具體原理這裡先賣個關子,後續的文章會詳細介紹。
可以使用ZRANGE
命令按照升序獲取對應的值,比如:
> zrange kpl 0 -1
1) "VG"
2) "TES"
3) "EDG.M"
4) "RNG.M"
5) "XQ"
6) "QGhappy"
7) "eStarPro"
0和-1代表查詢從第一個到最後一個的元素。還可以使用ZREVRANGE
命令按照降序獲取對應的值,比如:
> zrevrange kpl 0 -1
1) "eStarPro"
2) "QGhappy"
3) "XQ"
4) "RNG.M"
5) "EDG.M"
6) "TES"
7) "VG"
加上WITHSCORES
參數,就可以連同分數一起返回,比如:
> zrange kpl 0 -1 withscores
1) "VG"
2) "2"
3) "TES"
4) "4"
5) "EDG.M"
6) "8"
7) "RNG.M"
8) "8"
9) "XQ"
10) "10"
11) "QGhappy"
12) "12"
13) "eStarPro"
14) "12"
有序集合還有更強大的功能,比如在分數範圍內操作,讓我們獲取小於10(含)的戰隊,使用ZRANGEBYSCORE
命令:
> zrangebyscore kpl -inf 10
1) "VG"
2) "TES"
3) "EDG.M"
4) "RNG.M"
5) "XQ"
這就是獲取分數從負無窮到10所對應的值,同樣的我們也可以獲取分數從4到10所對應的值:
> zrangebyscore kpl 4 10
1) "TES"
2) "EDG.M"
3) "RNG.M"
4) "XQ"
另外有用的命令:ZRANK
命令,它可以返回指定值的升序排名(從0開始);ZREVRANK
命令,它可以返回指定值的降序排名(從0開始),比如:
> zrank kpl "EDG.M"
(integer) 2
> zrevrank kpl "EDG.M"
(integer) 4
有序集合的分數是隨時更新的,只要對已有的有序集合調用ZADD
命令,就會以O(log(N))時間複雜度更新其分數和排序。這樣,當有大量更新時,有序集合是合適的。由於這種特性,常見的場景是排行榜,可以方便地顯示排名前N位的用戶和用戶在排行榜中的排名。
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
哈希(Hash)
Redis的哈希和人們期望的“哈希”結構是一樣的,它是一個無序哈希,內部存儲了很多鍵值對,比如:
> hmset one-more-fans:100 name Lily age 25
OK
> hget one-more-fans:100 name
"Lily"
> hget one-more-fans:100 age
"25"
> hgetall one-more-fans:100
1) "name"
2) "Lily"
3) "age"
4) "25"
儘管哈希很容易用來表示對象,但是實際上可以放入哈希中的欄位數是沒有實際限制的,因此您可以以更多種的不同方式使用哈希。除了HGET
命令獲取單個欄位對應的值,也可以使用HMSET
命令獲取多個欄位及對應的值,它返回的是一個數組,比如:
> hmget one-more-fans:100 name age non-existent-field
1) "Lily"
2) "25"
3) (nil)
還可以使用HINCRBY
命令,為指定欄位的值做增量,比如:
> hget one-more-fans:100 age
"25"
> hincrby one-more-fans:100 age 3
(integer) 28
> hget one-more-fans:100 age
"28"
Redis哈希的實現結構,和Java中的HashMap是一樣的,也是“數組+鏈表”的結構,當發生數組位置碰撞是,就會將碰撞的元素用鏈表串起來。不過Redis為了追求高性能,rehash的方式不太一樣,這裡先賣個關子,後續的文章會詳細介紹。
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
點陣圖(Bitmap)
點陣圖不是實際的數據類型,而是在String類型上定義的一組面向位的操作。 由於字元串是二進位安全的,並且最大長度為512MB,因此可以設置多達2^32個不同的位。點陣圖操作分為兩類:固定單個位操作,比如將一個位設置為1或0或獲取其值;對位組的操作,比如計算給定位範圍內設置位的數量。
點陣圖的最大優點之一是,它們在存儲信息時通常可以節省大量空間。例如,在以增量用戶ID位標識表示用戶是否要接收新聞通訊,僅使用512 MB記憶體就可以記住40億用戶的一位信息。
使用SETBIT
和GETBIT
命令來設置和獲取指定位,比如:
> setbit one-more-key 10 1
(integer) 0
> getbit one-more-key 10
(integer) 1
> getbit one-more-key 11
(integer) 0
SETBIT
命令將位號作為其第一個參數,將其設置為1或0的值作為其第二個參數。如果位號超出當前字元串長度,該命令將會自動擴大字元串。GETBIT
命令只是返回指定位號的位的值,如果位號超出存儲的字元串長度則會返回0。
對位組的操作有以下3個命令:
BITOP
命令可以在不同的字元串之間執行按位運算,提供的位運算有與、或、非和異或。BITCOUNT
命令可以統計指定範圍內位數為1的個數。BITPOS
命令可以查找指定範圍內為0或1的第一位。
> set one-more-key "\x13\x7f" #二進位為0001 0011 0111 1111
OK
> bitcount one-more-key #整個字元串中1的位數
(integer) 10
> bitcount one-more-key 0 0 #第一個字元(0001 0011)中1的位數
(integer) 3
> bitcount one-more-key 1 1 #第二個字元(0111 1111)中1的位數
(integer) 7
> bitpos one-more-key 0 #整個字元串中第一個0位
(integer) 0
> bitpos one-more-key 1 #整個字元串中第一個1位
(integer) 3
> bitpos one-more-key 1 0 0 #第一個字元(0001 0011)中第一個1位
(integer) 3
> bitpos one-more-key 1 1 1 #第二個字元(0111 1111)中第一個1位
(integer) 9
點陣圖可以應用於各類實時分析,也可以節省空間高效地存儲位信息。比如,記錄用戶每天的簽到數據,每一個位表示用戶是否簽到過,這樣就可以計算出某個時間段用戶簽到了幾次,某個時間段用戶第一次簽到是哪一天。
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
HyperLogLogs
HyperLogLog是一種概率數據結構,用於統計唯一元素的數量,也可以理解為估計集合中元素的個數。
通常情況下,對唯一元素進行統計數量時,需要使用與要統計的元素數量成比例的記憶體量,因為需要記住過去已經看到的元素,以避免多次對其進行統計。但是,有一組演算法可以以記憶體換取精度,最終會得到帶有標準誤差的估計數量,在Redis的HyperLogLogs中,該誤差小於1%。
這個演算法的神奇之處在於,不再需要使用與所統計元素數量成比例的記憶體量,而可以使用恆定數量的記憶體。在最壞的情況下占據12KB的記憶體空間,Redis對HyperLogLog的存儲進行了優化,在計數比較少時,占據的記憶體空間會更小,這裡先賣個關子,後續的文章會詳細介紹其中原理。
在集合中,可以將每個元素添加到集合中,並使用SCARD
命令獲取集合中的元素數量,因為SADD
命令不會重新添加現有元素,所以元素都是唯一的。HyperLogLog的操作和集合比較類似,使用PFADD
命令將元素添加到HyperLogLog中,類似於集合的SADD
命令;使用PFCOUNT
命令獲取HyperLogLog中的唯一元素的當前近似值數量,類似於集合的SCARD
命令。比如:
> pfadd one-more-hll a b c d e
(integer) 1
> pfcount one-more-hll
(integer) 5
Redis中的HyperLogLog儘管在技術上是不同的數據結構,但被編碼為字元串,因此可以調用GET
命令來序列化HyperLogLog,然後調用SET
命令來將其反序列化回伺服器。
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。
總結
Redis提供更加豐富的數據結構,鍵(Key)和字元串(String),都是二進位安全的字元串;列表(List),根據插入順序排序的字元串元素列表,基於鏈表實現;集合(Set),唯一的亂序的字元串元素的集合;有序集合(Sorted Set),與集合類似,但是每個字元串元素都與一個稱為score的數字相關聯;哈希(Hash),由欄位與值相關聯組成的映射,欄位和值都是字元串;點陣圖(Bitmap),像操作位數組一樣操作字元串值,可以設置和清除某個位,對所有為1的位進行計數,找到第一個設置1的位,找到第一個設置0的位等等;HyperLogLogs,一種概率數據結構,使用較小的記憶體空間來統計唯一元素的數量,誤差小於1%。
歡迎關註微信公眾號:萬貓學社,每周一分享Java技術乾貨。