【Java面試】Kafka 怎麼避免重覆消費

来源:https://www.cnblogs.com/mic112/archive/2022/06/24/16408897.html
-Advertisement-
Play Games

Hi,大家好,我是Mic 一個工作5年的粉絲找到我。 他說: “Mic老師,你要是能回答出這個問題,我就佩服你” 我當場就懵了,現在打賭都這麼隨意了嗎? 我問他問題是什麼,他說“Kafka如何避免重覆消費的問題!” 下麵看看普通人和高手的回答! 普通人: Kafka怎麼避免重覆消費就是我們可以通過 ...


Hi,大家好,我是Mic

一個工作5年的粉絲找到我。

他說: “Mic老師,你要是能回答出這個問題,我就佩服你”

我當場就懵了,現在打賭都這麼隨意了嗎?

我問他問題是什麼,他說“Kafka如何避免重覆消費的問題!”

下麵看看普通人和高手的回答!

普通人:

Kafka怎麼避免重覆消費就是我們可以通過 我們可以在那個消息消費的這一端就是我們可以用類似於分散式鎖的這樣一個設計吧。

我消費一個消息的時候我可以直接用比如說redis裡面的setNx這樣一個指令,然後去把那個消息保存到redis裡面然後後面再如果重覆發送的話那我就直接只要去判斷這個Redis裡面有沒有存在就好了。

高手:

好的,關於這問題,我從幾個方面來回答。

首先Kafka Broker上存儲的消息,都有一個Offset標記。

然後kafka的消費者是通過offSet標記來維護當前已經消費的數據,

每消費一批數據,Kafka Broker就會更新OffSet的值,避免重覆消費。

image-20220513132307557

預設情況下,消息消費完以後,會自動提交Offset的值,避免重覆消費。

Kafka消費端的自動提交邏輯有一個預設的5秒間隔,也就是說在5秒之後的下一次向Broker拉取消息的時候提交。

所以在Consumer消費的過程中,應用程式被強制kill掉或者宕機,可能會導致Offset沒提交,從而產生重覆提交的問題。

除此之外,還有另外一種情況也會出現重覆消費。

在Kafka裡面有一個Partition Balance機制,就是把多個Partition均衡的分配給多個消費者。

Consumer端會從分配的Partition裡面去消費消息,如果Consumer在預設的5分鐘內沒辦法處理完這一批消息。

就會觸發Kafka的Rebalance機制,從而導致Offset自動提交失敗。

而在重新Rebalance之後,Consumer還是會從之前沒提交的Offset位置開始消費,也會導致消息重覆消費的問題。

image-20220513140121369

基於這樣的背景下,我認為解決重覆消費消息問題的方法有幾個。

  1. 提高消費端的處理性能避免觸發Balance,比如可以用非同步的方式來處理消息,縮短單個消息消費的市場。或者還可以調整消息處理的超時時間。還可以減少一次性從Broker上拉取數據的條數。
  2. 可以針對消息生成md5然後保存到mysql或者redis裡面,在處理消息之前先去mysql或者redis裡面判斷是否已經消費過。這個方案其實就是利用冪等性的思想。

以上就是我對這個問題的理解。

總結

重覆消費這個問題很重要,如果沒有考慮到就會出現線上的數據問題。

所以在面試的時候,這些問題也能夠考察求職者的技術能力以及實踐能力。

另外,關於冪等性的問題,我在前面的視頻裡面有講,大家可以自己找一找。

喜歡我的作品的小伙伴記得點贊和收藏加關註。

file

版權聲明:本博客所有文章除特別聲明外,均採用 CC BY-NC-SA 4.0 許可協議。轉載請註明來自 Mic帶你學架構
如果本篇文章對您有幫助,還請幫忙點個關註和贊,您的堅持是我不斷創作的動力。歡迎關註「跟著Mic學架構」公眾號公眾號獲取更多技術乾貨!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • ​ 目錄 散點圖 折線圖 柱狀圖 水平柱狀圖 水平堆疊圖 水平百分比柱狀圖 盒須圖 餅狀圖 雷達圖 Qt散點圖、折線圖、柱狀圖、盒須圖、餅狀圖、雷達圖開發實例。 在開發過程中我們會使用多各種各樣的圖,講數據進行可視化。我們可以使用以上幾種圖來表達我們的數據。Qt提供了一些可視化圖的庫Qchart,我 ...
  • 07函數 1. 判斷素數函數 類型:函數 描述‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬ 寫一個函數isPrime(n ...
  • 04簡單迴圈 1. 用一行代碼求和 類型: 簡單迴圈 描述‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‫‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‮‬‪‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‭‬‪‬‪‬‪‬‪‬‪‬‪‬‮‬‫‬‪‬ 輸入一個正整數 ...
  • 一、實驗目的 在信息時代高速發展的現在,“互聯網+”的使用日趨zhanzhang過互聯網學習知識,傳遞思想,溝通交流,在眾多數據和用戶的碰 撞中,互聯網經濟應運而生。學會利用網路收集信息是最基本的要求,接下來,我將以“行業網站”——站長之 家為例,通過Python爬取各個網站的信息(主要為名稱、Al ...
  • Go 語言入門練手項目系列 01 基於命令行的圖書的增刪查改 02 文件管理 持續更新中... > 本文來自博客園,作者:Arway,轉載請註明原文鏈接:https://www.cnblogs.com/cenjw/p/gobeginner-proj-bookstore-cli.html 介紹 這是一 ...
  • 1.路徑處理 1.找模塊:sys.path import sys print(sys.path) - 1.理解 - 1.是python去查找包或模塊 - 2.項目開始根目錄,python內置的目錄 - 3.雖然說python的安裝目錄下也可以存放我們寫的模塊,但是不建議(太多了,不大好找) - 4. ...
  • 本篇內容將在上一篇已有的內容基礎上,進一步的聊一下項目中使用JPA的一些高階複雜場景的實踐指導,覆蓋了主要核心的JPA使用場景,可以讓你在需求開發的時候對JPA的使用更加的游刃有餘。 ...
  • 前言 Steam是由美國電子游戲商Valve於2003年9月12日推出的數字發行平臺,被認為是電腦游戲界最大的數位發行平臺之一,Steam平臺是全球最大的綜合性數字發行平臺之一。玩家可以在該平臺購買、下載、討論、上傳和分享游戲和軟體。 而每周的steam會開啟了一輪特惠,可以讓游戲打折,而玩家就會 ...
一周排行
    -Advertisement-
    Play Games
  • # 通過圖片流來返回圖片 # 前言 之前寫了個圖片介面,然後做了個授權,但是光返回圖片地址雖然能適應大部分需求,但是考慮到有些人不想去處理返回值,也是做了個直接返回圖片流的介面。 # 介面展示 ## 返回指定寬度和高度圖片流 ![image](https://img2023.cnblogs.com/ ...
  • System.Speech是.NET框架的一部分,提供了語音識別和語音合成的功能。通過使用System.Speech命名空間中的類,開發人員可以在.NET應用程式中實現語音識別功能。 在本文中,我將演示如何使用 System.Speech.NET,這是開發語音應用程式比較牛逼的內庫。它適用於 .NE ...
  • 導航屬性 導航屬性是作為.NET ORM核心功能中的核心,在SqlSugar沒有支持導航屬性前,都說只是一個高級DbHelper, 經過3年的SqlSugar重構已經擁有了一套 非常成熟的導航屬性體系,本文不是重點講SqlSugar而是重點講導航屬性的作用,讓更多寫Sql人還未使用ORM的人瞭解到O ...
  • SM2是國家密碼管理局於2010年12月17日發佈的橢圓曲線公鑰密碼演算法。 產生背景: 隨著密碼技術和電腦技術的發展,目前常用的1024位RSA演算法面臨嚴重的安全威脅,我們國家密碼管理部門經過研究,決定採用SM2橢圓曲線演算法替換RSA演算法。 SM2演算法和RSA演算法都是公鑰密碼演算法,SM2演算法是一種 ...
  • # 使用c#實現23種常見的設計模式 設計模式通常分為三個主要類別: - 創建型模式 - 結構型模式 - 行為型模式。 這些模式是用於解決常見的對象導向設計問題的最佳實踐。 以下是23種常見的設計模式並且提供`c#代碼案例`: ## 創建型模式: ### 1. 單例模式(Singleton) ``` ...
  • ## 一:背景 ### 1. 講故事 在這麼多的案例分析中,往往會發現一些案例是卡死線上程的內核態棧上,但拿過來的dump都是用戶態模式下,所以無法看到內核態棧,這就比較麻煩,需要讓朋友通過其他方式生成一個藍屏的dump,這裡我們簡單彙總下。 ## 二:如何生成內核態dump ### 1. 案例代碼 ...
  • 有時候,我們為了方便,我們往往使用擴展函數的代碼方式創建很多GridView的操作功能,如在隨筆《在DevExpress中使用BandedGridView表格實現多行表頭的處理》中介紹過多行表頭的創建及綁定處理,在《基於DevExpress的GridControl實現的一些界面處理功能》也介紹了一些... ...
  • # 1、背景 在我們開發的過程中有這麼一種場景, `/projectA` 目錄是 `hadoopdeploy`用戶創建的,他對這個目錄有`wrx`許可權,同時這個目錄屬於`supergroup`,在這個組中的用戶也具有這個目錄的`wrx`許可權,對於其他人,不可訪問這個目錄。現在有這麼一個特殊的用戶`r ...
  • 基於java的倉庫管理系統設計與實現,可適用於出庫、入庫、庫存管理,基於java的出入庫管理,java出入庫管理系統,基於java的WMS倉庫管理系統,庫存物品管理系統。 ...
  • 清醒點[toc] # Java虛擬線程 > 翻譯自 screencapture-pradeesh-kumar-medium-an-era-of-virtual-threads-java ```mermaid flowchart LR introduction-->a(why thread)-->b( ...