Kafka的分散式架構與高可用性

来源:https://www.cnblogs.com/88223100/archive/2023/09/01/Kafka-Distributed-Architecture-and-High-Availability.html
-Advertisement-
Play Games

導語 一開始我們就說過Kafka是一款開源的高吞吐、分散式的消息隊列系統,那麼今天我們就來說下它的分散式架構和高可用性以及雙/多中心部署。 Kafka 體系架構簡介 以下是 Kafka 的軟體架構,整個 Kafka 體繫結構由 Producer、Consumer、Broker、ZooKeeper 組 ...


圖片

導語

一開始我們就說過Kafka是一款開源的高吞吐、分散式的消息隊列系統,那麼今天我們就來說下它的分散式架構和高可用性以及雙/多中心部署。

Kafka 體系架構簡介

以下是 Kafka 的軟體架構,整個 Kafka 體繫結構由 Producer、Consumer、Broker、ZooKeeper 組成。Broker 又由 Topic、分區、副本組成。

圖片

詳細可以參考 Kafka 官方文檔,Kafka introduction。

分散式與高可用

Kafka通過其分散式架構來實現高可用性。以下是Kafka分散式架構與高可用性之間的關係:

  1. 分散式數據存儲:Kafka的主題被分為多個分區,每個分區都可以有多個副本。這些副本可以分佈在不同的Broker節點上,形成分散式的數據存儲。這種分散式存儲使得數據在多個節點上冗餘存儲,即使某個節點發生故障,其他副本仍然可用,保證了數據的高可用性。

  2. 冗餘備份:Kafka中的每個分區都可以配置多個副本,這些副本被分佈在不同的Broker節點上。當一個Broker節點發生故障時,其他副本可以接管該分區並繼續提供服務。這種冗餘備份機制保證了即使多個節點發生故障,系統仍然可以繼續工作,避免了單點故障,提高了可用性。

  3. ISR機制:Kafka使用ISR(In-Sync Replicas)機制來保證數據的可靠性和一致性。ISR是指與Leader副本保持同步的副本集合。當消息被寫入Leader副本後,必須等待ISR中的所有副本完成寫入操作,才會返回確認給生產者。這樣可以保證消息的複製和同步,提高數據的可靠性和一致性。

  4. 動態的故障轉移:Kafka具備自動故障轉移能力。當一個Broker節點發生故障時,ISR中的其他副本會參與到Leader選舉過程中,自動選舉新的Leader副本,併進行分區重平衡。這樣可以快速恢復系統的可用性,保證生產者和消費者能夠無縫地繼續工作。

  5. 水平擴展:Kafka的分散式架構支持水平擴展。通過增加更多的Broker節點,可以擴展Kafka集群的吞吐量和容量。水平擴展提高了系統的伸縮性,使得Kafka能夠處理大規模的數據流和高併發的讀寫請求。

  6. 多中心數據互為災備:即一般為了避免天災人禍大型項目都會在不同地域部署相同的數據數據中心,彼此之間互為災備。

多中心相關術語

  • RTO(Recovery Time Objective):即數據恢復時間目標。指如果發生故障,發生故障轉移時業務系統所能容忍的最長停止服務時間。如果需要 RTO 越低,就越要避免手工操作,只有自動化故障轉移才能實現比較低的 RTO。

  • RPO(Recovery Point Objective):即數據恢復點目標。指如果發生故障,故障轉移需要從數據歷史記錄中的哪個點恢復。換句話說,有多少數據會在故障期間丟失。

  • 災難恢復(Disaster Recovery): 涵蓋所有允許應用程式從災難中恢復的體繫結構、實現、工具、策略和過程的總稱,在本文檔的上下文中,是指整個區域故障。

  • 高可用性(High Availability): 一個高度可用的系統即使在出現故障的情況下也可以連續運行。在多區域架構的上下文中,高可用性應用程式即使在整個區域故障期間也可以運行。HA 應用程式具有災難恢復策略。

發生故障的場景

不論是在虛擬化或容器化架構下,還是在提供成熟服務的雲廠商上,但都有可能因為各種因素髮生局部和系統故障,因此就需要考慮整體系統容災能力及可用性。

下麵列出一些典型的故障場景

序號 故障場景 影響 緩解措施
1 單節點故障 單個節點或托管在該節點上的 VM 的功能喪失 集群部署
2 機架或交換機故障 該機架內托管的所有節點/虛擬機(和/或連接)丟失 集群部署分佈在多個機架和/或網路故障域中
3 DC/DC-機房故障 在該 DC/DC 機房內托管的所有節點/虛擬機(和/或連接)丟失 擴展集群、複製部署
4 區域故障 該區域內托管的所有節點/虛擬機(和/或連接)丟失 地理延伸集群(延遲相關)和/或複製部署
5 全球性系統性中斷(DNS 故障、路由故障等) 影響客戶和員工的所有系統和服務完全中斷 離線備份;第三方域中的副本
6 人為行為(無意或惡意) 在檢測之前,人為行為可能會破壞數據和任何同步副本的可用性 離線備份

這篇文章重點圍繞故障場景2、3、4說明 Kafka 中有哪些方案來應對這幾類故障場景。第1種單節點故障,Kafka 集群高可用可以應對;第5、6種故障可以考慮將數據存儲到第三方系統,如果在雲上可以轉儲到 COS。

雙/多中心的應用場景

  • 跨地域複製
    在項目比較大的時候,可能需要在多個地域部署中心服務,以增加系統的容災能力和業務能力,每個數據中心都有自己的 Kafka 集群,這裡就涉及到應用和Kafka集群之間的訪問,是本地訪問還是跨中心訪問。

  • 災備
    任何集群服務都會收到天災、人禍等因素影響穩定性,比如地震,火災,高溫、超低溫等等,Kafka 集群可能因為這些不可預估的原因導致不可用,這時就需要有另外的與第一個集群完全相同的集群。如果有任何一個集群出現不可用情況,其他中心可以及時頂上,也就是所謂的互為災備。

  • 集群的物理隔離
    多環境設置,數據隔離部署。

  • 雲遷移和混合雲部署
    在雲計算流行的今天,部分公司會將業務同時部署在本地 IDC 和雲端。本地 IDC 和每個雲服務區域可能都會有 Kafka 集群,應用程式會在這些 Kafka 集群之間傳輸數據。例如,雲端部署了一個應用,它需要訪問 IDC 里的數據,IDC 里的應用程式負責更新這個數據,並保存在本地的資料庫中。可以捕獲這些數據變更,然後保存在 IDC 的 Kafka 集群中,然後再鏡像到雲端的 Kafka 集群中,讓雲端的應用程式可以訪問這些數據。這樣既有助於控制跨數據中心的流量成本,也有助於提高流量的監管合規性和安全性。

  • 法律和法規要求
    見題知意。

跨數據中心Kafka的部署形態

一般來說,Kafka 跨數據中心部署大體分兩種形態:Stretched Cluster和Connected Cluster。

Stretched Cluster

延展集群,它本質上是單個集群,是使用Kafka內置的複製機制來保持broker副本的同步。通過配置min.insync.replicas和acks=all,可以確保每次寫入消息時都可以收到至少來自兩個數據中心的確認。

圖片

Connected Cluster

連接集群,一般通過非同步複製完成多地域複製,並且使用外部工具將數據從一個(或多個)集群複製到另一個集群。該工具中會有Kafka消費者從源集群消費數據,然後利用Kafka生產者將數據生產到目的集群。但Confluent提供了一種不使用外部工具實現此功能的連接集群,在下麵介紹商業化方案的時候再詳細說明。

圖片

下麵是這兩種部署形態的對比

部署形態 數據傳輸方式 Offset 保留 延遲 RTO&RPO 何時使用
Stretched Cluster 同步 可以 0 數據中心距離較短
Connected Cluster 非同步 可以 取決於網路 >0 數據中心較遠

以這兩種部署形態可以形成多種部署方式,有興趣的朋友可以深入研究下。

作者:小年輕在奮鬥

本文來自博客園,作者:古道輕風,轉載請註明原文鏈接:https://www.cnblogs.com/88223100/p/Kafka-Distributed-Architecture-and-High-Availability.html


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 從Oracle 10g 開始,Oracle提供了鎖定/解鎖表統計信息功能,它的目的是阻止資料庫自動收集統計信息,防止可能會產生/出現的糟糕的計劃。它對於數據頻繁更改的Volatile Tables最有用,因為Volatile Tables的某些數據集可能會生成糟糕的計劃。 官方的介紹如下: Prev ...
  • 我喜歡Kusto (或商用版本 Azure Data Explorer,簡稱 ADX) 是大家可以有目共睹的,之前還專門寫過這方面的書籍,請參考 [大數據分析新玩法之Kusto寶典](https://kusto.book.xizhang.com), 很可能在今年還會推出第二季,正在醞釀題材和場景中。 ...
  • 本章詳細指導了你如何安裝 HarmonyOS SDK、配置開發環境、創建 HarmonyOS 項目。現在,你已經準備好開始 HarmonyOS 開發了。 ...
  • TV屏使用遙控器控制,通過焦點操作界面,就跟電視投屏類似 一共兩個核心,焦點的處理,按鍵的監聽處理 按鍵原生提供了onKeyDown 來監聽,通過不同的 keyCode 區分不同的按鍵 一般如果沒有遙控器,可以通過電腦鍵盤測試,使用投屏軟體投屏後,對鍵盤按鍵效果跟遙控器類似 有時候沒有實體按鍵(比如 ...
  • 寫博客也有一個月了,發現博客園自帶的主題都不太好看,然後搜索了一下發現這款主題【Cnblogs-Theme-SimpleMemory】界面還挺好看的,也是開源的。那[西瓜程式猿]就以這個主題來介紹一下如何在博客園中進行配置,跟著一起來操作吧! ...
  • # 概述 Content-Type和Accept是兩個HTTP標頭(HTTP headers),用於在HTTP請求和響應之間傳遞有關請求的數據類型和響應的首選內容類型的信息。這兩個標頭在HTTP通信中起著關鍵的作用。 1. Content-Type: - `Content-Type` 是HTTP請求 ...
  • # ExpressJS集成express-ws [TOC] ## 版本 ```JSON "express": "~4.16.1", "express-ws": "^5.0.2", ``` ## 簡單使用 - app.js ```JS const express = require('express' ...
  • # vscode使用圖片所遇到的問題 1、截屏出來的圖片放到像素大廚量時發現量出來的像素太大 解決方法一: 設置設計圖為2x,這樣能把誤差降低很多,但跟實際大小還是差了一些,可以自己在微調。如下圖所示 ![屏幕截圖 2023-09-01 135647](https://gitee.com/zheng ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...