企業業務一直依賴於其收集的數據,但這些數據集正在不斷增長。即使需要提取的數據存儲量非常龐大,Redis Enterprise 7.2也能使應用程式能以最快的速度檢索和處理數據。利用自動分層技術,可以識別冷數據和熱數據,並分別存儲在記憶體和固態硬碟上,顯著提升了系統響應速度,優化記憶體占用的同時降低硬體成... ...
越來越多的應用程式依賴於龐大的數據集合,而這些應用程式必須快速響應。藉助自動分層,Redis Enterprise 7.2 幫助開發人員輕鬆創建超快的應用程式。何樂而不為?
Redis將數據存儲在記憶體中,因此應用程式能以最快的速度檢索和處理數據。然而,隨著應用程式需要處理的數據越多,存儲數據集所需的記憶體越大,所耗費的成本則更高,Redis Enterprise自動分層技術能很好地化解這個兩難的局面。
一、問題:記憶體有限且昂貴
當應用程式訪問的數據量很大,例如達到TB級時,開發人員就面臨著記憶體有限的問題,他們一般使用基於磁碟的解決方案來在幕後支持 Redis。這樣一來,開發人員就不得不在應用程式中構建整個數據管理系統,這意味著他們要把時間花在不相干的任務上。
利用 Redis Enterprise 的自動分層功能,開發人員可以使用固態硬碟(SSD)作為可用記憶體的一部分,將大容量資料庫擴展到SSD中。Redis Enterprise 可以隨時識別哪些數據應留在記憶體中,哪些數據應留在固態硬碟上,從而將吞吐量提高一倍,並將延遲減半。
因此,開發人員無需編寫額外的代碼或學習其他新技術。通過將動態 RAM 與高速外部存儲相結合,Redis Enterprise 可以輕鬆高效地使用系統資源,同時還能快速訪問熱數據。
二、自動分層的工作原理
自動分層可自動管理數據。它會將熱數據轉移到 DRAM,並智能地將未使用的數據轉移到 SSD。這為依賴大型數據集的應用帶來了新的可能性。
通過將訪問頻率較低的冷數據轉移到固態硬碟,開發人員可以優化記憶體使用,降低與大容量記憶體需求相關的成本。
實際上,這可以使數據量大的應用程式運行得更快,而無需開發人員額外付出。與僅使用 DRAM 的部署相比,它還能節省高達 70% 的基礎硬體設施成本。而且,由於自動分層可以高效地自動管理數據訪問模式,因此您無需花費時間(計算或人工篩選)來識別熱數據和冷數據。
為了增強這一功能,Redis 與創新的鍵值存儲引擎 Speedb 建立了戰略合作伙伴關係。我們將其技術整合為預設的自動分層引擎。
集成 Speedb 後,Redis Enterprise 的性能顯著提升,在訪問相同資源的情況下,吞吐量翻倍,延遲減半。這大大拓寬了可利用自動分層優勢的用例範圍。在這一改進之後,Redis Enterprise 使用自動分層的資料庫規模由每個內核 5k ops/秒增至10k ops/秒。
三、數據案例
我們來看一個案例。
下圖展示了自動分層在實際工作負載場景中的性能演變示例。藍色條代表使用以前的存儲引擎(RocksDB)的 Redis Enterprise 6.4,紅色條代表使用 Speedb 的 Redis Enterprise 7.2。在基礎設施方面,我們使用 I4i.8xlarge AWS 實例在 10 個分片上托管 1TB 資料庫,為實現高可用性,採用總共 20 個分片,為 1,024 個客戶端提供服務。
為了模擬最標準的 Redis 用例,我們在 20% DRAM 和 80% SSD 的配置上定義了兩種不同的有效載荷(1KiB 和 10KiB),並提供了三種可能的使用模式:平衡讀/寫(1:1)、重讀(1:4)和重寫(4:1)。在這兩種情況下,我們測量了以每秒操作數為單位的吞吐量和相應的延遲。以下圖表顯示了結果。
RAM/SSD數據占比2:8,單次操作1KB值
與 RS 6.4 (RocksDB) 相比,RS 7.2 (Speedb) 改進了:
- 85% 命中率時:每秒操作次數增加 1.4 倍至 1.6 倍,同時延遲降低高達 2.4 倍
- 50% 命中率時:每秒操作次數增加 1.9 倍至 2.3 倍,同時延遲降低高達 3.8 倍
RAM/SSD數據占比2:8,單次操作10KB值
與 RS 6.4 (RocksDB) 相比,RS 7.2 (Speedb) 改進了:
- 85% 命中率時:每秒操作次數增加 2.3 倍至 3.0 倍,同時延遲降低高達 3.0 倍
- 50% 命中率時:每秒操作次數增加 2.1 倍至 3.5 倍,同時延遲降低高達 3.5 倍
在所有情況下,帶有 Speedb 的 Redis Enterprise 7.2 都具有更好的吞吐量,這意味著維持這種性能水平所需的應用程式速度更快,基礎設施更少。
四、應用場景
自動分層尤其適用於將數據分為熱數據和冷數據的情況。
1.移動銀行
讓我們來看看移動銀行應用的例子。
如今,每個人的移動設備上都有銀行應用程式。用戶登錄應用程式,獲取餘額,查看最後一筆交易,並獲取其他相對較小和集中的信息。每個人都希望這一過程流暢、簡單、即時。這些數據就是我們的熱數據,存放在 Redis Enterprise 資料庫的 DRAM 中。
用戶希望獲得更多信息的情況並不常見,例如舊交易記錄--也許是兩年前的稅務數據。用戶需要訪問這些數據,但數據訪問速度並不那麼重要。這種數據集是我們的冷數據,可以保存在高速外部存儲如固態硬碟中。
2.游戲行業
速度在游戲行業也很重要。例如,游戲應用對延遲有嚴格要求。另外,從本質上講,游戲是一種潮流。隨著時間的推移,游戲公司會積累越來越多的用戶數據,並將其存儲在用戶資料資料庫中,但並非所有用戶都是活躍用戶。通過自動分層,活躍用戶的資料數據可以存儲在 DRAM 中,而其他用戶的數據則存儲在 SSD 中。