【Java面試】Kafka 怎麼避免重覆消費

来源:https://www.cnblogs.com/mic112/archive/2022/06/24/16408897.html
-Advertisement-
Play Games

Hi,大家好,我是Mic 一個工作5年的粉絲找到我。 他說: “Mic老師,你要是能回答出這個問題,我就佩服你” 我當場就懵了,現在打賭都這麼隨意了嗎? 我問他問題是什麼,他說“Kafka如何避免重覆消費的問題!” 下麵看看普通人和高手的回答! 普通人: Kafka怎麼避免重覆消費就是我們可以通過 ...


Hi,大家好,我是Mic

一個工作5年的粉絲找到我。

他說: “Mic老師,你要是能回答出這個問題,我就佩服你”

我當場就懵了,現在打賭都這麼隨意了嗎?

我問他問題是什麼,他說“Kafka如何避免重覆消費的問題!”

下麵看看普通人和高手的回答!

普通人:

Kafka怎麼避免重覆消費就是我們可以通過 我們可以在那個消息消費的這一端就是我們可以用類似於分散式鎖的這樣一個設計吧。

我消費一個消息的時候我可以直接用比如說redis裡面的setNx這樣一個指令,然後去把那個消息保存到redis裡面然後後面再如果重覆發送的話那我就直接只要去判斷這個Redis裡面有沒有存在就好了。

高手:

好的,關於這問題,我從幾個方面來回答。

首先Kafka Broker上存儲的消息,都有一個Offset標記。

然後kafka的消費者是通過offSet標記來維護當前已經消費的數據,

每消費一批數據,Kafka Broker就會更新OffSet的值,避免重覆消費。

image-20220513132307557

預設情況下,消息消費完以後,會自動提交Offset的值,避免重覆消費。

Kafka消費端的自動提交邏輯有一個預設的5秒間隔,也就是說在5秒之後的下一次向Broker拉取消息的時候提交。

所以在Consumer消費的過程中,應用程式被強制kill掉或者宕機,可能會導致Offset沒提交,從而產生重覆提交的問題。

除此之外,還有另外一種情況也會出現重覆消費。

在Kafka裡面有一個Partition Balance機制,就是把多個Partition均衡的分配給多個消費者。

Consumer端會從分配的Partition裡面去消費消息,如果Consumer在預設的5分鐘內沒辦法處理完這一批消息。

就會觸發Kafka的Rebalance機制,從而導致Offset自動提交失敗。

而在重新Rebalance之後,Consumer還是會從之前沒提交的Offset位置開始消費,也會導致消息重覆消費的問題。

image-20220513140121369

基於這樣的背景下,我認為解決重覆消費消息問題的方法有幾個。

  1. 提高消費端的處理性能避免觸發Balance,比如可以用非同步的方式來處理消息,縮短單個消息消費的市場。或者還可以調整消息處理的超時時間。還可以減少一次性從Broker上拉取數據的條數。
  2. 可以針對消息生成md5然後保存到mysql或者redis裡面,在處理消息之前先去mysql或者redis裡面判斷是否已經消費過。這個方案其實就是利用冪等性的思想。

以上就是我對這個問題的理解。

總結

重覆消費這個問題很重要,如果沒有考慮到就會出現線上的數據問題。

所以在面試的時候,這些問題也能夠考察求職者的技術能力以及實踐能力。

另外,關於冪等性的問題,我在前面的視頻裡面有講,大家可以自己找一找。

喜歡我的作品的小伙伴記得點贊和收藏加關註。

file

版權聲明:本博客所有文章除特別聲明外,均採用 CC BY-NC-SA 4.0 許可協議。轉載請註明來自 Mic帶你學架構
如果本篇文章對您有幫助,還請幫忙點個關註和贊,您的堅持是我不斷創作的動力。歡迎關註「跟著Mic學架構」公眾號公眾號獲取更多技術乾貨!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ​ 目錄 散點圖 折線圖 柱狀圖 水平柱狀圖 水平堆疊圖 水平百分比柱狀圖 盒須圖 餅狀圖 雷達圖 Qt散點圖、折線圖、柱狀圖、盒須圖、餅狀圖、雷達圖開發實例。 在開發過程中我們會使用多各種各樣的圖,講數據進行可視化。我們可以使用以上幾種圖來表達我們的數據。Qt提供了一些可視化圖的庫Qchart,我 ...
  • 07函數 1. 判斷素數函數 類型:函數 描述‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬ 寫一個函數isPrime(n ...
  • 04簡單迴圈 1. 用一行代碼求和 類型: 簡單迴圈 描述‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬ 輸入一個正整數 ...
  • 一、實驗目的 在信息時代高速發展的現在,“互聯網+”的使用日趨zhanzhang過互聯網學習知識,傳遞思想,溝通交流,在眾多數據和用戶的碰 撞中,互聯網經濟應運而生。學會利用網路收集信息是最基本的要求,接下來,我將以“行業網站”——站長之 家為例,通過Python爬取各個網站的信息(主要為名稱、Al ...
  • Go 語言入門練手項目系列 01 基於命令行的圖書的增刪查改 02 文件管理 持續更新中... > 本文來自博客園,作者:Arway,轉載請註明原文鏈接:https://www.cnblogs.com/cenjw/p/gobeginner-proj-bookstore-cli.html 介紹 這是一 ...
  • 1.路徑處理 1.找模塊:sys.path import sys print(sys.path) - 1.理解 - 1.是python去查找包或模塊 - 2.項目開始根目錄,python內置的目錄 - 3.雖然說python的安裝目錄下也可以存放我們寫的模塊,但是不建議(太多了,不大好找) - 4. ...
  • 本篇內容將在上一篇已有的內容基礎上,進一步的聊一下項目中使用JPA的一些高階複雜場景的實踐指導,覆蓋了主要核心的JPA使用場景,可以讓你在需求開發的時候對JPA的使用更加的游刃有餘。 ...
  • 前言 Steam是由美國電子游戲商Valve於2003年9月12日推出的數字發行平臺,被認為是電腦游戲界最大的數位發行平臺之一,Steam平臺是全球最大的綜合性數字發行平臺之一。玩家可以在該平臺購買、下載、討論、上傳和分享游戲和軟體。 而每周的steam會開啟了一輪特惠,可以讓游戲打折,而玩家就會 ...
一周排行
    -Advertisement-
    Play Games
  • 使用原因: 在我們服務端調用第三方介面時,如:支付寶,微信支付,我們服務端需要模擬http請求並加上一些自己的邏輯響應給前端最終達到我們想要的效果 1.使用WebClient 引用命名空間 using System.Net; using System.Collections.Specialized; ...
  • WPF 實現帶蒙版的 MessageBox 消息提示框 WPF 實現帶蒙版的 MessageBox 消息提示框 作者:WPFDevelopersOrg 原文鏈接: https://github.com/WPFDevelopersOrg/WPFDevelopers.Minimal 框架使用大於等於.N ...
  • 一、JSON(JavaScript Object Notation)的簡介: ① JSON和XML類似,主要用於存儲和傳輸文本信息,但是和XML相比,JSON更小、更快、更易解析、更易編寫與閱讀。 ② C、Python、C++、Java、PHP、Go等編程語言都支持JSON。 二、JSON語法規則: ...
  • 1.避免Scoped模式註冊的服務變成Singleton模式 當提供一個生命周期模式為Singleton的服務實例時,如果發現該服務中還依賴生命周期模式為Scoped的服務實例(Scoped服務實例將被一個Singleton服務實例所引用),那麼這個被依賴的Scoped服務實例最終會成為一個Sing ...
  • 索引時資料庫提高數據查詢處理性能的一個非常關鍵的技術,索引的使用可以對性能產生上百倍甚至上千倍的影響。接下來,會介紹索引的基本原理、概念,並深入學習資料庫中所使用的索引結構和存儲方式,以及如何管理、維護索引等。 1.索引的基本概念 索引時用來快速查詢表記錄的一種存儲結構,一般使用索引有一下兩個方面: ...
  • django2 路由控制器 Route路由,是一種映射關係。路由是把客戶端請求的url路徑和用戶請求的應用程式,這裡意指django裡面的視圖進行綁定映射的一種關係。 請求路徑和視圖函數不是一一對應的關係 在django中所有的路由最終都被保存到一個叫urlpatterns的文件里,並且該文件必須在 ...
  • 1、我們的目標是獲取微博某博主的全部圖片、視頻 2、拿到網址後 我們先觀察 打開F12 隨著下滑我們發現載入出來了一個叫mymblog的東西,展開響應發現需要的東西就在裡面 3、重點來了!!! 通過觀察發現第二頁比第一頁多了參數since_id 而第二頁的since_id參數剛好在上一頁中能獲取到, ...
  • 一、實現原理 在Servlet3協議規範中,包含在JAR文件/META-INFO/resources/路徑下的資源可以直接訪問。 二、舉例說明 如下圖所示,是我新建的一個Spring Boot Starter項目:zimug-minitor-threadpool,用於實現可配置、可觀測的線程池。其中 ...
  • 精華筆記: static final常量:應用率高 必須聲明同時初始化 由類名打點來訪問,不能被改變 建議:常量所有字母都大寫,多個單詞用_分隔 編譯器在編譯時會將常量直接替換為具體的數,效率高 何時用:數據永遠不變,並且經常使用 抽象方法: 由abstract修飾 只有方法的定義,沒有具體的實現( ...
  • Python有一個for...else語法,它的寫法如下 for i in range(0,100): if i == 3: break else: print("Not found") 該語句表示:若for迴圈遍歷完畢,則執行else部分的語句。也就是說上述代碼不會有任何輸出,而下述代碼會輸出“N ...