【轉載】Kafka介紹及升級經驗分享

来源:http://www.cnblogs.com/bluejoe/archive/2016/01/09/5116699.html
-Advertisement-
Play Games

http://blog.talkingdata.net/?p=3165背景當時的現狀:開始使用Kafka的時候,使用的版本是0.7.2,當時的目的是為了替代kestrel,主要是使用Kafka來做消息傳輸中間件。Kafka解決了我們當時使用Kestrel遇到的最大的三個問題:吞吐量、數據量、一份數據...


http://blog.talkingdata.net/?p=3165

  • 背景

當時的現狀:開始使用Kafka的時候,使用的版本是0.7.2,當時的目的是為了替代kestrel,主要是使用Kafka來做消息傳輸中間件。Kafka解決了我們當時使用Kestrel遇到的最大的三個問題:吞吐量、數據量、一份數據多次消費。

  • 為什麼要升級

相比其它開源項目,Kafka的升級比較麻煩,其根本原因主要是作為消息傳輸中間件,涉及的系統多。既然升級麻煩,而且Kafka 0.7在這一年多來運行穩定,性能優異,那麼我們為什麼要升級呢?

其實之所以決定升級Kafka,主要有兩個原因,一是因為Kafka 0.7的scala版本是2.8,目前使用的多數開源框架(Spark、Play等)都是基於2.10的scala了,而scala 2.10和2.8兩個版本是不相容的。二,是因為之前曾發生過Kafka伺服器RAID卡損壞的故障,期待Kafka 0.8的Replication功能。

  • 升級中遇到的問題及解決方案

1. 配置問題消費者找不到Broker

2. 問題描述消費者在消費數據的時候,連不上Broker

3. 問題原因Broker在正常啟動之後會在zookeeper中註冊自己的信息。消費者會根據這裡面的host和port去連接broker,host是在server.properties配置host.name配置的值,這個值如果不配置,那麼在Zookeeper中存放的就是Kafka這台伺服器的主機名而不是ip,所以消費者才會連不上。而在Kafka0.7中,類似的配置叫hostname,這個值如果不配置,它會調用InetAddress.getLocalHost()去獲取,獲取的值不一定是你想要的,在我們當時它獲取恰好是Kafka伺服器的ip。

4. 解決方案(其中一種)

修改server.properties中host.name的配置,把它改成ip。

修改消費者所在機器的hosts文件,加入Kafka主機名與ip的映射。

使用DNS(推薦)

  • 數據去哪了

1. 問題描述:

生產者生產10000條數據後停止,這時啟動消費者,發現消費者多不到任何東西,而且zookeeper中的offset居然和生產者生產了的offset一樣。如果這時啟動生產者繼續發送數據,消費者從第10001條數據開始讀取。之前的10000條數據都不見了。

2. 問題原因:Kafka的官方wiki的原話:

In 0.8, wehave moved to logical offsets from physical offsets. This means that theoffsets are not compatible. When you try to consume using the 0.7 offsets, youwould hit “OffsetOutOfRangeException”. The default behavior of theconsumer when this happens is based on the config value of “auto.offset.reset”.If it is set to “smallest”, the consumer will start consuming fromthe beginning. If it is set to “largest”, the consumer will startconsuming from the end.

3. 解決方案:給消費者增加auto.offset.reset配置,auto.offset.reset=smallest

  • 給”消息”減減肥

1. 問題描述:生產者或消費者拋出MessageSizeTooLargeException異常

2. 問題原因:這個異常的命名還是很直白的,消息太大了,去官網找找配置就解決了,比較鬱悶的就是同樣的消息大小,在Kafka0.7沒有配置相應的參數也不報錯。

3. 解決方案:

如果是生產者報錯,修改Kafka Broker的配置,在server.properties中配置message.max.bytes,預設是1M(約)。

如果是消費者報錯,修改消費者中增加fetch.message.max.bytes的配置,這個配置的值要大於Broker的message.max.bytes配置。

  • 性能問題:ACK參數配置

1. 問題描述:生產者上線後,吞吐量下降了1倍。

2. 問題原因:

首先檢查Kafka Broker,發現的不管是網路、IO、CPU等都沒有出現瓶頸,並且增加生產者線程或者生產者實例可以解決問題,假設生產者寫Kafka的速度是10000條每秒,那麼再部署一個生產者,兩者寫入速度均可以達到10000條,遂斷定問題出在生產者本身,通過jstack可以發現,線程都在做寫Kafka的操作,那麼寫Kafka究竟和0.7有什麼不一樣呢?

Kafka0.8有Replication功能,消息寫入Kafka中後,Followers會創建副本,生產者有個配置叫request.required.acks,當時配置的是1,生產者會等至少1個Followers創建完副本之後才算發送成功,平均響應時間變長,所以速度變慢。

3. 解決方案(其中一種)

增加生產者線程數或者生產者實例,系統的相應時間增加,但是系統的併發數並沒有到達上限,並且Kafka Broker可以平行擴展。設置request.required.acks=0,這樣做會有丟失數據的風險。

  • Producer鎖

1. 問題描述:生產者有很多的線程狀態都是BLOCKED,導致系統性能大幅度下降。

2. 問題原因:根據源代碼可以看出,生產者發送時是有鎖的,但這個鎖每個Producer對象各自持有各自的。

QQ截圖20150615172545

3. 解決方案:對於不同線程使其持有不同的producer對象。

  • 坑:文件分段大小配置有bug

1. 問題描述:

系統上線後我們遇到了文件句柄數過多的問題,如果配置的分段文件大小一樣,0.8會比0.7多4倍的文件數目,所以我們當時決定增加分段文件的大小,必須是一個Int,於是改成Int.Max,結果數據整個offset錯亂,文件損壞,集群不可用了。

2. 問題原因:

private def maybeRoll(messagesSize: Int): LogSegment = {

val segment = activeSegment

if (segment.size > config.segmentSize – messagesSize ||

segment.size > 0 && time.milliseconds – segment.created > config.segmentMs – segment.rollJitterMs ||

segment.index.isFull) {

……

roll()

} else {

segment

}

}

3. 解決方案:配小一些或者升級到0.8.2

  • 神一般的錯誤提示

1. 問題描述:Consumer消費時出現Iterator is in failed state的錯誤提示,錯誤量很多。

2. 問題原因:

這個錯誤並不是真正的錯誤,是因為MessageSizeTooLargeException導致的,發生MessageSizeTooLargeException異常會導致Iterator is in failed state錯誤的發生,但是MessageSizeTooLargeException只會列印一次,而那個錯誤會隨著讀取方法的調用不停的打,完全被帶跑偏了。

3. 解決方案:解決MessageSizeTooLargeException即可。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • span元素和div元素的區別:本章節簡單介紹一下span元素和div元素的區別,因為這兩個元素在佈局中非常的常用,可以說幾乎沒有任何頁面不適用這兩個元素,下麵就簡單介紹一下它們兩者的主要區別。一.元素的性質:span元素內聯元素,而div元素是塊級元素。關於兩種類型元素的區別可以參閱什麼是塊級元素...
  • jquery如何修改連接a的href屬性值:有時候可能需要動態的修改超鏈接的指向地址,下麵通過代代碼實例簡單的介紹一下。代碼實例如下:螞蟻部落網易以上代碼實現了我們的要求,代碼比較簡單,這裡就不多介紹了,具體可以參閱相關閱讀。相關閱讀:1.click事件可以參閱jQuery的click事件一章節。2...
  • js數組元素由小到大排序實例代碼:有時候需要對數組中的數字進行排序,下麵是一段將數組中數字由小到大排序的代碼實例,希望能夠幫到大家。實例代碼如下:var arr=[2,55,55,1,75,3,9,35,70,166,432,678,32,98];var len=arr.length;console...
  • IE6和IE7定位的相容問題簡單介紹:定位的瀏覽器相容性問題很小,就是IE6和IE7對z-index屬性的解析上有所差別,並且這兩個版本的瀏覽器在中國存活的估計也不會太長了,所以關於這個相容性問題有興趣的朋友可以參閱以下本章節,下麵就是一段關於此問題的實例代碼。代碼如下:螞蟻部落 以上代碼在I...
  • checkbox覆選框全選和取消全選實例代碼:關於覆選框的全選和不全選是非常常見的操作,本章節分享一段代碼實例,能夠實現多種選中和取消選中功能。代碼實例如下:螞蟻部落 螞蟻部落一 螞蟻部落二 螞蟻部落三 螞蟻部...
  • js父頁面使用iframe中的函數:iframe是非常常用的一個html元素,如果在父頁面中使用子頁面的方法應該怎麼寫呢,下麵就做一下簡單的介紹。一.父頁面代碼:父頁面-螞蟻部落 二.iframe中的代碼:iframe代碼-螞蟻部落上面兩個代碼可以在父頁面和子頁面對對方的函數進行相互調用,比較簡單....
  • 相容IE6瀏覽器的最大高度和最小高度css代碼:IE6瀏覽器是不支持最大高度和最小高度屬性的,下麵就通過相容性措施實現此功能。一.最大高度效果:.max_height{ max-height:400px; _height:expression(this.scrollHeight > 400 ? .....
  • ajax如何刪除X-Requested-With:在實際應用中,X-Requested-With一般用來判斷一個請求是否是ajax請求,不過有時候這個並不需要,所以要將其刪除,下麵就此就進行一下簡單介紹,希望能夠對需要的朋友帶來或多或少的幫助。解決方案如下:$.ajax({ url: 'http.....
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...