Redis通常被稱為單進程單線程模型。 這不是真的! Redis還運行多個後端線程來執行後端清理工作,例如清理臟數據和關閉文件描述符。在Redis中,主線程負責主要任務,包括但不限於:接收來自客戶端的連接,處理連接讀/寫事件,解析請求,處理命令,處理定時器事件和同步數據。只有一個CPU核心運行單個進 ...
Redis通常被稱為單進程單線程模型。
這不是真的!
Redis還運行多個後端線程來執行後端清理工作,例如清理臟數據和關閉文件描述符。在Redis中,主線程負責主要任務,包括但不限於:接收來自客戶端的連接,處理連接讀/寫事件,解析請求,處理命令,處理定時器事件和同步數據。只有一個CPU核心運行單個進程和單個線程。
對於小數據包,Redis伺服器可以處理80,000到100,000 QPS。更大的QPS超出了Redis伺服器的處理能力。常見的解決方案是在分散式架構中對數據進行分區並採用多個伺服器。
然而,該解決方案也具有許多缺點。例如,要管理的Redis伺服器太多; 某些適用於單個Redis伺服器的命令不適用於數據分區; 數據分區無法解決熱點讀/寫問題; 數據偏斜,重新分配和放大/縮小變得更加複雜。由於單進程和單線程的限制,我們希望可以重構多線程以充分利用SMP多核架構的優勢,從而提高單個Redis伺服器的吞吐量。
要使Redis成為多線程,最簡單的思考方式是每個線程都執行I / O和命令處理。但是,由於Redis處理的數據結構很複雜,多線程需要使用鎖來確保線程安全。鎖定粒度的不正確處理可能會降低性能。
我們建議增加I / O線程的數量,以使獨立的I / O線程能夠讀取/寫入連接,解析命令和回覆數據包中的數據,並且仍讓單個線程處理命令並執行計時器事件。這樣,可以增加單個Redis伺服器的吞吐量。
單進程和單線程模型
好處
-
由於單進程和單線程模型的限制,耗時的操作(例如dict rehash和過期的密鑰刪除)被分解為多個步驟併在Redis實現中逐個執行。這防止了操作長時間執行,因此避免了操作對系統的長時間阻塞。單進程和單線程代碼易於編譯,這減少了由多進程和多線程引起的上下文切換和鎖定占用。
缺點
-
只能使用一個CPU內核,無法利用多核優勢。
-
對於繁重的I / O應用程式,網路I / O操作會消耗大量CPU容量。使用Redis作為緩存的應用程式通常是繁重的I / O應用程式。這些應用程式基本上具有高QPS,使用相對簡單的命令(例如get,set和incr),但是對RT敏感。它們通常具有高帶寬使用率,甚至可能達到數百兆比特。由於10 GB和25 GB網路適配器的普及,網路帶寬不再是瓶頸。因此,我們需要考慮的是如何利用多核的優勢和網路適配器的性能。
多線程模型與實現
線程模型
有三種線程類型,即:
-
主線程
-
I / O線程
-
工人線程
-
主線程:接收連接,創建客戶端,並轉發到I / O線程的連接。
-
I / O線程:處理連接讀/寫事件,解析命令,將完整解析的命令轉發到工作線程進行處理,發送響應數據包並刪除連接。
-
工作線程:處理命令,生成客戶端響應數據包,並執行計時器事件。
-
主線程,I / O線程和工作線程分別由事件驅動。
-
線程通過無鎖隊列交換數據,並通過隧道發送通知。
多線程模型的好處
提高讀/寫性能
壓力測試結果表明,在小數據包場景中,讀/寫性能可提高約三倍。
-
-
提高主/從同步速度
當主設備將同步數據發送到從設備時,數據將在I / O線程中發送。從主站讀取數據時,從站從工作線程讀取完整數據,從I / O線程讀取增量數據。這可以有效地提高同步速度。
後續任務
第一項任務是增加I / O線程數並優化I / O讀/寫功能。接下來,我們可以分解工作線程,以便每個線程完成I / O讀取,以及工作線程的工作。
設置I / O線程數
-
測試結果表明I / O線程的數量不應超過6.否則,工作線程將成為簡單操作的瓶頸。
-
在啟動進程時,必須設置I / O線程的數量。進程運行時,無法修改I / O線程數。根據當前的連接分配策略,修改I / O線程的數量涉及重新分配連接,這非常複雜。
註意事項
-
隨著10 GB和25 GB網路適配器的普及,必須仔細考慮如何充分利用硬體性能。我們可以使用技術,例如用於networkI / O的多線程和內核繞過用戶模式協議棧。
-
I / O線程可用於實現無阻塞數據遷移。I / O線程對數據進程進行編碼或轉發命令,而目標節點對數據進行解碼或執行命令。
————————————————————
推薦閱讀:
-