前面說到了redis在單機的模式下是可以數據持久化的,但是不可以解決單點失敗的問題,當單台redis伺服器出現問題時,就可能會造成數據的丟失;想要解決這個問題的話我們可以使用Redis的主從模式這也是Redis集群最簡單的實現方式,這篇文章我就來簡單部署一個Redis主從架構,我準備了3台ubunt ...
前面說到了redis在單機的模式下是可以數據持久化的,但是不可以解決單點失敗的問題,當單台redis伺服器出現問題時,就可能會造成數據的丟失;想要解決這個問題的話我們可以使用Redis的主從模式這也是Redis集群最簡單的實現方式,這篇文章我就來簡單部署一個Redis主從架構,我準備了3台ubuntu1804的主機,IP地址分別為10.0.0.{101,102,103},主機名分別為master,slave1,slave2。
1、腳本安裝redis
#!/bin/bash #REDIS_VERSION=redis-7.0.5 #REDIS_VERSION=redis-7.0.3 #REDIS_VERSION=redis-6.2.6 REDIS_VERSION=redis-5.0.14 #REDIS_VERSION=redis-4.0.14 REDIS_URL=http://download.redis.io/releases PASSWORD=123456 INSTALL_DIR=/apps/redis CPUS=`lscpu |awk '/^CPU\(s\)/{print $2}'` . /etc/os-release color () { RES_COL=60 MOVE_TO_COL="echo -en \\033[${RES_COL}G" SETCOLOR_SUCCESS="echo -en \\033[1;32m" SETCOLOR_FAILURE="echo -en \\033[1;31m" SETCOLOR_WARNING="echo -en \\033[1;33m" SETCOLOR_NORMAL="echo -en \E[0m" echo -n "$1" && $MOVE_TO_COL echo -n "[" if [ $2 = "success" -o $2 = "0" ] ;then ${SETCOLOR_SUCCESS} echo -n $" OK " elif [ $2 = "failure" -o $2 = "1" ] ;then ${SETCOLOR_FAILURE} echo -n $"FAILED" else ${SETCOLOR_WARNING} echo -n $"WARNING" fi ${SETCOLOR_NORMAL} echo -n "]" echo } prepare(){ if [ $ID = "centos" -o $ID = "rocky" ];then yum -y install gcc make jemalloc-devel systemd-devel else apt update apt -y install gcc make libjemalloc-dev libsystemd-dev fi if [ $? -eq 0 ];then color "安裝軟體包成功" 0 else color "安裝軟體包失敗,請檢查網路配置" 1 exit fi } install() { if [ ! -f ${REDIS_VERSION}.tar.gz ];then wget ${REDIS_URL}/${REDIS_VERSION}.tar.gz || { color "Redis 源碼下載失敗" 1 ; exit; } fi tar xf ${REDIS_VERSION}.tar.gz -C /usr/local/src cd /usr/local/src/${REDIS_VERSION} make -j $CUPS USE_SYSTEMD=yes PREFIX=${INSTALL_DIR} install && color "Redis 編譯安裝完成" 0 || { color "Redis 編譯安裝失敗" 1 ;exit ; } ln -s ${INSTALL_DIR}/bin/redis-* /usr/bin/ mkdir -p ${INSTALL_DIR}/{etc,log,data,run} cp redis.conf ${INSTALL_DIR}/etc/ sed -i -e 's/bind 127.0.0.1/bind 0.0.0.0/' -e "/# requirepass/a requirepass $PASSWORD" -e "/^dir .*/c dir ${INSTALL_DIR}/data/" -e "/logfile .*/c logfile ${INSTALL_DIR}/log/redis-6379.log" -e "/^pidfile .*/c pidfile ${INSTALL_DIR}/run/redis_6379.pid" ${INSTALL_DIR}/etc/redis.conf if id redis &> /dev/null ;then color "Redis 用戶已存在" 1 else useradd -r -s /sbin/nologin redis color "Redis 用戶創建成功" 0 fi chown -R redis.redis ${INSTALL_DIR} cat >> /etc/sysctl.conf <<EOF net.core.somaxconn = 1024 vm.overcommit_memory = 1 EOF sysctl -p if [ $ID = "centos" -o $ID = "rocky" ];then echo 'echo never > /sys/kernel/mm/transparent_hugepage/enabled' >> /etc/rc.d/rc.local chmod +x /etc/rc.d/rc.local /etc/rc.d/rc.local else echo -e '#!/bin/bash\necho never > /sys/kernel/mm/transparent_hugepage/enabled' >> /etc/rc.local chmod +x /etc/rc.local /etc/rc.local fi cat > /lib/systemd/system/redis.service <<EOF [Unit] Description=Redis persistent key-value database After=network.target [Service] ExecStart=${INSTALL_DIR}/bin/redis-server ${INSTALL_DIR}/etc/redis.conf --supervised systemd ExecStop=/bin/kill -s QUIT \$MAINPID Type=notify User=redis Group=redis RuntimeDirectory=redis RuntimeDirectoryMode=0755 LimitNOFILE=1000000 [Install] WantedBy=multi-user.target EOF systemctl daemon-reload systemctl enable --now redis &> /dev/null if [ $? -eq 0 ];then color "Redis 服務啟動成功,Redis信息如下:" 0 else color "Redis 啟動失敗" 1 exit fi sleep 2 redis-cli -a $PASSWORD INFO Server 2> /dev/null } prepare install
#查看redis是否啟用
[root@slave2 ~]#systemctl status redis.service
● redis.service - Redis persistent key-value database
Loaded: loaded (/lib/systemd/system/redis.service; enabled; vendor preset: enabled)
Active: active (running) since Wed 2022-11-02 15:14:08 CST; 10min ago
Main PID: 12529 (redis-server)
Tasks: 4 (limit: 2236)
Memory: 1.7M
CGroup: /system.slice/redis.service
└─12529 /apps/redis/bin/redis-server 0.0.0.0:6379
11月 02 15:14:08 ubuntu2004 systemd[1]: Starting Redis persistent key-value database...
11月 02 15:14:08 ubuntu2004 systemd[1]: Started Redis persistent key-value database.
2、Redis主從複製
Redis的主從模式是可以實現Redis的數據跨主機備份,在配置主從的時候,從節點是需要開啟數據持久化並設置和主節點同樣的連接密碼。
2.1、預設redis狀態
剛安裝好後的redis三台機器都是master狀態,可以進到客戶端查詢一下
2.2、實現Redis主從複製
實現Redis的主從複製是有兩種方式的,一種你可以通過命令行來配置,這樣配置的話是臨時生效,命令行配置的話重啟Redis服務就沒有用了,但是同步過來的數據還是會保留的;另一種就是修改redis的配置文件來使其生效,這樣的話即使重啟redis服務主從的關係還在的。
2.2.1客戶端命令行配置
準備點數據
[root@master ~]#redis-cli -a 123456 Warning: Using a password with '-a' or '-u' option on the command line interface may not be safe. 127.0.0.1:6379> mset k1 v1 k2 v1 k3 v3 OK 127.0.0.1:6379> dbsize (integer) 3
使用命令行啟用主從
127.0.0.1:6379> replicaof 10.0.0.101 6379 OK 127.0.0.1:6379> INFO replication # Replication role:slave #角色已經變成了slave,但是狀態還是down,這時需要設置下主節點的連接密碼才能變成up master_host:10.0.0.101 master_port:6379 master_link_status:down master_last_io_seconds_ago:-1 master_sync_in_progress:0 slave_repl_offset:1 master_link_down_since_seconds:1667376380 slave_priority:100 slave_read_only:1 connected_slaves:0
slave2節點同樣操作
在master節點查看主從狀態
查看連接狀態
複製測試,發現之前的數據已經同步過來了
取消主從同步
我們是可以通過從節點執行replicaof no one命令即可取消主從複製,修改完後角色會變成master,並且之前同步的數據是不會丟的。
2.2.2修改配置文件
我們在前面使用了命令行實現了主從複製,命令行配置是有缺陷的,當從節點的redis服務重啟後就失效了;為瞭解決這個缺陷我們可以將命令行配置的內容加到配置文件中,在重啟一下redis服務讓其讀取配置文件。
[root@slave2 ~]#echo -e "replicaof 10.0.0.101 6379\nmasterauth 123456" >> /apps/redis/etc/redis.conf [root@slave2 ~]#tail -2 /apps/redis/etc/redis.conf replicaof 10.0.0.101 6379 masterauth 123456
[root@slave2 ~]#systemctl restart redis.service
登錄上去查看主從關係
3、主從複製故障與恢復
3.1、從節點故障與恢復
當從節點出現故障時,只需將Redis客戶端指向其他的從節點就可以了,並不會對整體的架構的讀操作進行太大的影響,即使所有的從節點出現故障,也可以直接訪問主節點進行讀的操作;不過一般從節點出現故障後,除了一些特殊情況一般都會儘快的修複好,從而減輕其他節點的工作負載。
3.2、主節點故障與恢復
當我們的主節點故障時,我們可以將一個從節點提升為新的主節點,在將另一個從節點指向到新的主節點,當原來的主節點修複好了後,把Redis服務起來後會發現恢復到了單機的狀態,並且只有之前的數據。過程和之前一樣我就不做演示了。
如果現在想要將原的主節點變成現有的主從架構的從節點,這樣的話就可以將新的主節點(slave1)的數據同步過來了;但是想要保持之前的原節點不變的話,就需要將現在的主從架構中的節點都指向原節點,並且剛剛新增的key也就會丟失;這裡我們可以保持原先的master節點為主節點為例,這裡可以把slave2設置成原master節點的從節點,我們也是可以直接把現在新主節點(slave1)設置成原master節點的從節點,這樣的話就形成了級聯複製,這樣的話slave可以不用修改配置,這樣的話slave2是從slave1來同步數據,而slave1從master節點同步數據。
4、主從複製的優化
4.1、主從複製過程
Redis主從複製可以分為全量同步和增量同步。
4.1.1、全量複製的過程
第一次都是需要主從同步是全量同步的,主從同步可以讓從節點到主節點進行同步數據,而且從節點也可以有從節點,也就是前面演示的級聯複製的架構;
Redis的主從同步是非阻塞的,master節點收到從伺服器的psync(在2.8版本之前是SYNC)命令,會fork一個子進程在後臺執行bgsave命令,並將新寫入的數據先寫入到一個緩衝區中,bgsave執行完成之後,再將生成的RDB文件發送給slave節點,然後master節點再將緩衝區的內容以redis協議格式再全部發送給slave節點,slave節點先刪除舊數據,slave節點將收到後的RDB文件載入自己的記憶體,再載入所有收到緩衝區的內容,從而這樣一次完整的數據同步。
Redis全量複製一般發生在Slave首次初始化階段,這時Slave需要將Master上的所有數據都複製一份。
4.1.2、增量複製的過程
在全量同步之後再次需要同步時,從伺服器只要發送當前的offset位置(等同於MySQL的binlog的位置)給主伺服器,然後主伺服器根據相應的位置將之後的數據(包括寫在緩衝區的積壓數據)發送給從伺服器,再次將其保存到從節點記憶體即可。
4.1.3、主從同步完整過程
- 從伺服器連接主伺服器,發送PSYNC命令。
- 當主伺服器接收到PSYNC命令後,開始執行BGSAVE命令生成RDB快照文件並使用緩衝區記錄此後執行的所有寫命令。
- 當主伺服器BGSAVE執行完後,向所有從伺服器發送RDB快照文件,併在發送期間繼續記錄被執行的寫命令。
- 從伺服器收到快照文件後丟棄所有舊數據,載入收到的快照至記憶體。
- 主伺服器快照發送完畢後,開始向從伺服器發送緩衝區中的寫命令。
- 從伺服器完成對快照的載入,開始接收命令請求,並執行來自主伺服器緩衝區的寫命令。
- 後期同步會先發送自己slave_repl_offset位置,只同步新增加的數據,不再全量同步。
4.2、主從複製的主要事項
4.2.1、避免全量複製
- 第一次的全量複製是沒法避免的,後續的全量複製是可以利用小主節點(記憶體小),儘量在業務低峰時進行全量複製;
- 在主節點重啟後會發現運行的ID發生了變化,可能會觸發全量複製,可以利用故障轉移,例如哨兵或者集群的方式,而從節點重啟的話是不會導致全量複製的;
- 當複製積壓緩衝區不足時,主節點生成的新數據大與緩衝區的大小,從節點恢復和主節點連接後,這樣會導致全量複製,這個是可以修改repl-backlog-size的值來解決,將其值調大。
4.2.2、避免複製的風暴
單主節點複製的風暴:當主節點重啟後,多個從節點會同時從主節點複製數據,這樣的話是會帶來複制風暴,解決方式可以更換複製的架構,比如可以使用級聯複製的架構。
單機器多實例的複製風暴:當伺服器出現宕機時,後面有修複了,這樣的話就會進行大量的全量複製,並引發複製風暴,解決的方法是主節點分散多機器。
4.3、主從複製優化配置
repl-diskless-sync no # 是否使用無盤同步RDB文件,預設為no,no為不使用無盤,需要將RDB文件保存到磁碟後再發送給slave,yes為支持無盤,支持無盤就是RDB文件不需要保存至本地磁碟,而且直接通過socket文件發送給slave repl-diskless-sync-delay 5 #diskless時複製的伺服器等待的延遲時間 repl-ping-slave-period 10 #slave端向server端發送ping的時間間隔,預設為10秒 repl-timeout 60 #設置主從ping連接超時時間,超過此值無法連接,master_link_status顯示為down,並記錄錯誤日誌 repl-disable-tcp-nodelay no #是否啟用TCP_NODELAY,如設置成yes,則redis會合併小的TCP包從而節省帶寬, 但會增加同步延遲(40ms),造成master與slave數據不一致,假如設置成no,則redis master會立即發送同步數據,沒有延遲,yes關註網路性能,no關註redis服務中的數據一致性 repl-backlog-size 1mb #master的寫入數據緩衝區,用於記錄自上一次同步後到下一次同步過程中間的寫入命令,計算公式:repl-backlog-size = 允許從節點最大中斷時長 * 主實例offset每秒寫入量,比如master每秒最大寫入64mb,最大允許60秒,那麼就要設置為64mb*60秒=3840MB(3.8G),建議此值是設置的足夠大 repl-backlog-ttl 3600 #如果一段時間後沒有slave連接到master,則backlog size的記憶體將會被釋放。如果值為0則 表示永遠不釋放這部份記憶體。 slave-priority 100 #slave端的優先順序設置,值是一個整數,數字越小表示優先順序越高。當master故障時將會按照優先順序來選擇slave端進行恢復,如果值設置為0,則表示該slave永遠不會被選擇。 min-replicas-to-write 1 #設置一個master的可用slave不能少於多少個,否則master無法執行寫 min-slaves-max-lag 20 #設置至少有上面數量的slave延遲時間都大於多少秒時,master不接收寫操作(拒絕寫入)
5、常見主從複製故障
5.1、master密碼不對
即主節點在Redis配置文件中設置的requirepass部分,從節點在執行主從同步命令時或者修改配置文件時未添加正確,則會導致無法建立主從同步關係。
5.2、redis版本不一致
不同的redis大版本之間是會存在相容性的問題的,例如大版本3和大版本4之間,大版本4和大版本5之間,因此各master節點和slave節點之間必須保持版本的一致。
5.3、無法遠程連接
當在開啟了安全模式的情況下,沒有設置bind地址或者密碼的話,外部是訪問不了的,也就是沒辦法遠程連接。
5.4、配置不一致
- 當主從節點的maxmemory不一致,主節點的記憶體大雨從節點的記憶體時,這樣就可能會出現主從複製丟失數據的情況。
- 主從節點的rename-command命令不一致,例如在主節點定義了flushall,flushdb,而在從節點上沒有定義,這樣的話在主節點執行flushall或者flushdb的話,在從節點的數據是沒有同步的。