kafka核心概念Broker、Topic、Partition和Replication

来源:https://www.cnblogs.com/ydswin/p/18169055
-Advertisement-
Play Games

在Kafka中,Broker、Topic、Partition和Replication是四個核心概念,它們各自扮演了不同的角色並共同協作以確保數據的可靠性、可擴展性和高性能。以下是關於這四個概念的詳細解釋: Broker(代理) * Broker是Kafka集群中的一個節點,負責存儲和轉發消息。Kaf ...


在Kafka中,BrokerTopicPartitionReplication是四個核心概念,它們各自扮演了不同的角色並共同協作以確保數據的可靠性、可擴展性和高性能。以下是關於這四個概念的詳細解釋:

Broker(代理)

* Broker是Kafka集群中的一個節點,負責存儲和轉發消息。Kafka集群由多個Broker組成。
* Broker接收來自生產者的消息,為消息設置Offset,並提交消息到磁碟保存。同時,Broker也負責將消息轉發給消費者。
* Broker之間通過協調機制維護Topic和Partition的元數據信息,確保整個集群的數據一致性和可用性。
* Broker提供了API介面,供生產者和消費者使用。生產者通過API發送消息到Topic中,消費者通過API讀取Topic中的消息。

Topic(主題)

* Kafka中的Topic是一個邏輯上的概念,用於組織和存儲消息。你可以將Topic看作是一個特定的消息類別或者類型,它代表了一類數據或事件。
* 生產者(Producer)向特定的Topic發送消息,而消費者(Consumer)則從Topic中消費消息。
* Kafka的分散式特性使得一個Topic可以被劃分為多個Partition,這些Partition可以分佈在不同的Broker上,以實現數據的並行處理和存儲。

Partition(分區)

* Partition是Kafka中實際保存數據的單位,是Topic的物理劃分。每個Topic都可以被劃分為一個或多個Partition。
* 為了實現擴展性,一個非常大的Topic可以分佈到多個Broker上,即一個Topic可以包含多個Partition,每個Partition是一個有序的隊列。
* 當一條消息發送到Kafka時,它會被分配到一個特定的Partition中,並最終寫入Partition對應的日誌文件里。這個分配過程可以根據一定的規則進行,如按照消息的某個屬性進行哈希或者按照時間戳進行排序等。
* Partition中的每條消息都會被分配一個有序的ID(Offset),消費者通過Offset來追蹤已經消費的消息位置。

Replication(副本)

* Kafka通過副本機制提供高可用性和數據持久性。每個Partition都可以配置多個副本(Replica),這些副本分佈在不同的Broker上。
* 在一個Partition的多個副本中,有一個副本被選舉為Leader,其他副本則為Follower。Leader負責處理讀寫請求,而Follower則實時從Leader同步數據。
* 當某個Broker出現故障時,Kafka可以自動從其他Broker上的Follower副本中選舉出新的Leader,以確保服務的可用性。
* 通過設置適當的副本因數(Replication Factor),可以在保證數據可靠性的同時提高系統的容錯能力。

這四個概念共同協作,使得Kafka能夠處理大量的實時數據流,並提供高吞吐量、低延遲和可擴展性。在Kafka集群中,通過合理配置Topic、Partition、Replication和Broker等參數,可以優化系統的性能和可靠性。

Kafka 是一個流處理平臺,用於構建實時數據管道和流應用。在 Kafka 中,Producer、Consumer、Event 和 Offset 是核心概念。下麵我將簡要解釋這些概念:

Producer(生產者)

  • 生產者是向 Kafka 集群發送(或稱為“生產”)消息的應用程式。
  • 生產者將消息發送到 Kafka 的一個或多個主題(Topic)中。
  • 生產者發送的消息被追加到該主題的分區(Partition)中。

Consumer(消費者)

  • 消費者是從 Kafka 集群讀取(或稱為“消費”)消息的應用程式。
  • 消費者訂閱一個或多個主題,並從這些主題的分區中讀取消息。
  • 消費者組(Consumer Group)是多個消費者的集合,它們共同讀取一個主題的消息,但每個分區只能被一個消費者組中的一個消費者讀取。

Event(事件)

  • 在 Kafka 的語境中,事件(或稱為“消息”)是生產者發送到 Kafka 主題並被消費者讀取的數據單元。
  • 事件可以包含各種類型的數據,如字元串、JSON 對象等。
  • 事件是 Kafka 中數據流的基本單位。

Offset(偏移量)

  • 偏移量是 Kafka 中用於唯一標識分區中每個消息的序列號。
  • 當消息被追加到分區時,Kafka 會為每個消息分配一個遞增的偏移量。
  • 消費者使用偏移量來跟蹤它已經讀取到哪個位置,以便在故障恢復或重新連接時能夠繼續從正確的位置讀取消息。
  • Kafka 提供了 API 來允許消費者提交和獲取其偏移量,以確保消息的可靠消費。

消費者的消費模型

消費者使用偏移量來跟蹤其消費進度。消費者可以手動提交偏移量,也可以讓 Kafka 在滿足一定條件(如成功處理消息)後自動提交偏移量。Kafka 還提供了“至少一次”和“至多一次”等語義來確保消息的可靠傳遞。

  • Current Position:表示消費者當前正在讀取的消息的偏移量。
  • Last Committed Offset:表示消費者最近一次提交的偏移量。它表示消費者已經成功處理並確認的消息的邊界。
  • Log End Offset (LEO):表示分區中最後一條消息的偏移量。對生產者來說,它表示即將插入下一條消息的偏移量。
  • High Watermark (HW):表示已經成功備份到其他副本中的最新一條數據的偏移量。它表示消費者可以安全讀取的消息的邊界,因為這部分消息已經被覆制到足夠多的副本中,即使某些副本出現故障也不會丟失數據。

本文來自博客園,作者:dashery,轉載請註明原文鏈接:https://www.cnblogs.com/ydswin/p/18169055


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • Docker安裝 1、Rocky Linux 下載Rocky Linux 安裝 Docker 引擎 |Docker 文檔 阿裡雲開源鏡像 1.1、設置存儲庫 安裝軟體包(提供實用程式)並設置存儲庫。 yum-utils yum-config-manager sudo yum install -y y ...
  • 一:keystone組件部署 只在控制節點上面操作 1、安裝和配置keystone # 1.安裝keystone軟體包 # wsgi:使web伺服器支持WSGI的插件 # httpd:Apache軟體包 # openstack-keystone:keystone的軟體包 [root@controll ...
  • title: 進程間通信 cover: https://img2.imgtp.com/2024/04/30/9GnvXoDg.png tags: - 通信 - linux categories: linux系統編程 引言 進程間通信(interprocess communication,簡稱 IPC ...
  • 目錄網路配置服務管理防火牆配置文件下載wget和curl網路連接信息netstat和ss Linux 網路管理涉及一系列任務,包括配置網路介面、設置IP地址、管理網路服務和防火牆等。 網路配置 網卡命名 根據網路介面定義設備: ethX 傳統的乙太網介面命名方式,其中 X 通常是數字,如 eth0 ...
  • 大數據面試SQL每日一題系列:最高峰同時線上主播人數。位元組,快手等大廠高頻面試題 之後會不定期更新每日一題sql系列。 SQL面試題每日一題系列內容均來自於網路以及實際使用情況收集,如有雷同,純屬巧合。 1.題目 問題1:如下為某直播平臺各主播的開播及關播時間數據明細,現在需要計算該平臺最高峰期同時 ...
  • 一、下載mysql安裝包 官網:https://dev.mysql.com/downloads/mysql/ 預設會跳轉到最新版本的下載頁面,也可以在舊版本集中選擇需要安裝的版本。 MSI Installer是安裝程式,ZIP Archive是壓縮包形式。 二、安裝mysql MSI安裝程式會有圖形 ...
  • 摘要:作為Valkey社區的Technical Steering Committee member,華為雲將持續參與社區建設。 一、背景 今年3月21日,Redis Labs宣佈從Redis 7.4版本開始,將原先比較寬鬆的BSD源碼使用協議修改為RSAv2和SSPLv1協議,意味著 Redis在O ...
  • 本文介紹基於Microsoft SQL Server軟體,實現資料庫表中多種數據查詢方法的具體操作。 目錄1 指定列或全部列查詢——查詢S表學生記錄2 指定列或全部列查詢——查詢學生姓名與出生年份3 按條件查詢及模糊查詢——查詢成績不及格學生學號4 按條件查詢及模糊查詢——查詢20-23歲間學生姓名 ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...