大廠們的 redis 集群方案

来源:https://www.cnblogs.com/me115/archive/2018/05/15/9043420.html
-Advertisement-
Play Games

redis 集群方案主要有兩類,一是使用類 codis 的架構,按組劃分,實例之間互相獨立; 另一套是基於官方的 redis cluster 的方案;下麵分別聊聊這兩種方案; 類 codis 架構 這套架構的特點: 分片演算法:基於 slot hash桶; 分片實例之間相互獨立,每組 一個master ...


redis 集群方案主要有兩類,一是使用類 codis 的架構,按組劃分,實例之間互相獨立;
另一套是基於官方的 redis cluster 的方案;下麵分別聊聊這兩種方案;

類 codis 架構

這套架構的特點:

  • 分片演算法:基於 slot hash桶;
  • 分片實例之間相互獨立,每組 一個master 實例和多個slave;
  • 路由信息存放到第三方存儲組件,如 zookeeper 或etcd
  • 旁路組件探活

使用這套方案的公司:
阿裡雲: ApsaraCache, RedisLabs、京東、百度等

codis

slots 方案:劃分了 1024個slot, slots 信息在 proxy層感知; redis 進程中維護本實例上的所有key的一個slot map;

遷移過程中的讀寫衝突處理:
最小遷移單位為key;
訪問邏輯都是先訪問 src 節點,再根據結果判斷是否需要進一步訪問 target 節點;

  • 訪問的 key 還未被遷移:讀寫請求訪問 src 節點,處理後訪問:
  • 訪問的 key 正在遷移:讀請求訪問 src 節點後直接返回;寫請求無法處理,返回 retry
  • 訪問的 key 已被遷移(或不存在):讀寫請求訪問 src 節點,收到 moved 回覆,繼續訪問 target 節點處理

阿裡雲

AparaCache 的單機版已開源(開源版本中不包含slot等實現),集群方案細節未知;ApsaraCache

百度 BDRP 2.0

主要組件:
proxy,基於twemproxy 改造,實現了動態路由表;
redis內核: 基於2.x 實現的slots 方案;
metaserver:基於redis實現,包含的功能:拓撲信息的存儲 & 探活;
最多支持1000個節點;

slot 方案:
redis 內核中對db劃分,做了16384個db; 每個請求到來,首先做db選擇;

數據遷移實現:
數據遷移的時候,最小遷移單位是slot,遷移中整個slot 處於阻塞狀態,只支持讀請求,不支持寫請求;
對比 官方 redis cluster/ codis 的按key粒度進行遷移的方案:按key遷移對用戶請求更為友好,但遷移速度較慢;這個按slot進行遷移的方案速度更快;

京東

主要組件:
proxy: 自主實現,基於 golang 開發;
redis內核:基於 redis 2.8
configServer(cfs)組件:配置信息存放;
scala組件:用於觸發部署、新建、擴容等請求;
mysql:最終所有的元信息及配置的存儲;
sentinal(golang實現):哨兵,用於監控proxy和redis實例,redis實例失敗後觸發切換;

slot 方案實現:
在記憶體中維護了slots的map映射表;

數據遷移:
基於 slots 粒度進行遷移;
scala組件向dst實例發送命令告知會接受某個slot;
dst 向 src 發送命令請求遷移,src開啟一個線程來做數據的dump,將這個slot的數據整塊dump發送到dst(未加鎖,只讀操作)
寫請求會開闢一塊緩衝區,所有的寫請求除了寫原有數據區域,同時雙寫到緩衝區中。
當一個slot遷移完成後,把這個緩衝區的數據都傳到dst,當緩衝區為空時,更改本分片slot規則,不再擁有該slot,後續再請求這個slot的key返回moved;
上層proxy會保存兩份路由表,當該slot 請求目標實例得到 move 結果後,更新拓撲;

跨機房:跨機房使用主從部署結構;沒有多活,異地機房作為slave;

基於官方 redis cluster 的方案

和上一套方案比,所有功能都集成在 redis cluster 中,路由分片、拓撲信息的存儲、探活都在redis cluster中實現;各實例間通過 gossip 通信;這樣的好處是簡單,依賴的組件少,應對400個節點以內的場景沒有問題(按單實例8w read qps來計算,能夠支持 200 * 8 = 1600w 的讀多寫少的場景);但當需要支持更大的規模時,由於使用 gossip協議導致協議之間的通信消耗太大,redis cluster 不再合適;

使用這套方案的有:AWS, 百度貼吧

官方 redis cluster

數據遷移過程:
基於 key粒度的數據遷移;
遷移過程的讀寫衝突處理:
從A 遷移到 B;

  • 訪問的 key 所屬slot 不在節點 A 上時,返回 MOVED 轉向,client 再次請求B;
  • 訪問的 key 所屬 slot 在節點 A 上,但 key 不在 A上, 返回 ASK 轉向,client再次請求B;
  • 訪問的 key 所屬slot 在A上,且key在 A上,直接處理;(同步遷移場景:該 key正在遷移,則阻塞)

AWS ElasticCache

ElasticCache 支持主從和集群版、支持讀寫分離;
集群版用的是開源的Redis Cluster,未做深度定製;

百度貼吧的ksarch-saas:

基於redis cluster + twemproxy 實現;後被 BDRP 吞併;
twemproxy 實現了 smart client 功能;使用 redis cluster後還加一層 proxy的好處:

  1. 對client友好,不需要client都升級為smart client;(否則,所有語言client 都需要支持一遍)
  2. 加一層proxy可以做更多平臺策略;比如在proxy可做 大key、熱key的監控、慢查詢的請求監控、以及接入控制、請求過濾等;

即將發佈的 redis 5.0 中有個 feature,作者計劃給 redis cluster加一個proxy。

ksarch-saas 對 twemproxy的改造已開源:
https://github.com/ksarch-saas/r3proxy


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Grub(GRand Unified Bootloader),統一資源引導器,它的工作是提供一個菜單,允許用戶選擇要啟動的系統或不同的內核版本;把用戶選定的內核裝載到RAM中的特定空間中,然後解壓、展開,而後把系統控制權移交給內核。 Grub目前有兩個版本: 1、GRUB 0.X:Grub Lega ...
  • 用Linux已經有很長一段時間,但主要用於嵌入式開發(用交叉工具鏈進行版本編譯),所以用命令行就可以了,而且敲的最多的命令就是make。最近開始搭建TensorFlow的開發環境,大部分工作都是命令行完成,再加上TensorBoard可以實現web化展示,所以團隊共用一臺機器SSH接入就可以了。但是 ...
  • 目錄管理 ls、cd、pwd、mkdir、rmdir、tree ls(list) 列出,列表 用法: ls -l:長格式 文件類型: -:普通文件 (f) d: 目錄文件 b: 塊設備文件 (block) c: 字元設備文件 (character) l: 符號鏈接文件(symbolic link f ...
  • 為了方便自己快速使用命令,接觸了一下alias。在使用多個命令時,一般有兩種方式。各有不同 根據需求選擇。 直接上代碼: 1.alias Name='(date;pwd;cmd1;cmd2) 寫法簡潔容易。 2.alias da='da(){ date;pwd;who|wc -l;};da' 雖然有 ...
  • 想用中文系統,卻不想用中文文件夾,可以用以下方法: 先把home路徑下的桌面文件夾修改為Desktop 然後在命令行輸入 修改後ctrl -x然後確認修改重啟就行了 ...
  • 重啟網路失敗截圖 從本質上來看出現這樣的問題,是因為拷貝過來的虛擬機重新分配了網卡MAC地址。這樣造成的結果是配置文件中MAC與當前網卡MAC不一致。所以只需要修改一下配置文件即可。 ...
  • 1.安裝mysql客戶端流程: - 登錄navicat官網下載 - 將壓縮包拷貝ubuntu中進行解壓,解壓命令:tar zxvf navicat.tar.gz - 進入解壓目錄,運行命令./start_navicatt - 如果試用是灰色的則進行下一步 - 刪除 .navicat64/ 隱藏文件, ...
  • 一、簡介 MongoDB是一種強大、靈活,且易於擴展的通用型資料庫。他能擴展出非常多的功能。如二級索引(secondary index)、範圍查詢(range query)、排序、聚合(aggregation),以及地理空間索引(geospatial index)。 1、易於使用 MongoDB是一 ...
一周排行
    -Advertisement-
    Play Games
  • 示例項目結構 在 Visual Studio 中創建一個 WinForms 應用程式後,項目結構如下所示: MyWinFormsApp/ │ ├───Properties/ │ └───Settings.settings │ ├───bin/ │ ├───Debug/ │ └───Release/ ...
  • [STAThread] 特性用於需要與 COM 組件交互的應用程式,尤其是依賴單線程模型(如 Windows Forms 應用程式)的組件。在 STA 模式下,線程擁有自己的消息迴圈,這對於處理用戶界面和某些 COM 組件是必要的。 [STAThread] static void Main(stri ...
  • 在WinForm中使用全局異常捕獲處理 在WinForm應用程式中,全局異常捕獲是確保程式穩定性的關鍵。通過在Program類的Main方法中設置全局異常處理,可以有效地捕獲並處理未預見的異常,從而避免程式崩潰。 註冊全局異常事件 [STAThread] static void Main() { / ...
  • 前言 給大家推薦一款開源的 Winform 控制項庫,可以幫助我們開發更加美觀、漂亮的 WinForm 界面。 項目介紹 SunnyUI.NET 是一個基於 .NET Framework 4.0+、.NET 6、.NET 7 和 .NET 8 的 WinForm 開源控制項庫,同時也提供了工具類庫、擴展 ...
  • 說明 該文章是屬於OverallAuth2.0系列文章,每周更新一篇該系列文章(從0到1完成系統開發)。 該系統文章,我會儘量說的非常詳細,做到不管新手、老手都能看懂。 說明:OverallAuth2.0 是一個簡單、易懂、功能強大的許可權+可視化流程管理系統。 有興趣的朋友,請關註我吧(*^▽^*) ...
  • 一、下載安裝 1.下載git 必須先下載並安裝git,再TortoiseGit下載安裝 git安裝參考教程:https://blog.csdn.net/mukes/article/details/115693833 2.TortoiseGit下載與安裝 TortoiseGit,Git客戶端,32/6 ...
  • 前言 在項目開發過程中,理解數據結構和演算法如同掌握蓋房子的秘訣。演算法不僅能幫助我們編寫高效、優質的代碼,還能解決項目中遇到的各種難題。 給大家推薦一個支持C#的開源免費、新手友好的數據結構與演算法入門教程:Hello演算法。 項目介紹 《Hello Algo》是一本開源免費、新手友好的數據結構與演算法入門 ...
  • 1.生成單個Proto.bat內容 @rem Copyright 2016, Google Inc. @rem All rights reserved. @rem @rem Redistribution and use in source and binary forms, with or with ...
  • 一:背景 1. 講故事 前段時間有位朋友找到我,說他的窗體程式在客戶這邊出現了卡死,讓我幫忙看下怎麼回事?dump也生成了,既然有dump了那就上 windbg 分析吧。 二:WinDbg 分析 1. 為什麼會卡死 窗體程式的卡死,入口門檻很低,後續往下分析就不一定了,不管怎麼說先用 !clrsta ...
  • 前言 人工智慧時代,人臉識別技術已成為安全驗證、身份識別和用戶交互的關鍵工具。 給大家推薦一款.NET 開源提供了強大的人臉識別 API,工具不僅易於集成,還具備高效處理能力。 本文將介紹一款如何利用這些API,為我們的項目添加智能識別的亮點。 項目介紹 GitHub 上擁有 1.2k 星標的 C# ...