Kafka個人總結_ZenDei技術網路在線

Kafka個人總結

-Advertisement-

Kafka 應對場景：消息持久化、吞吐量是第一要求、狀態由客戶端維護、必須是分散式的。Kafka 認為 broker 不應該阻塞生產者，高效的磁碟順序讀寫能夠和網路 IO 一樣快，同時依賴現代 OS 文件系統特性，寫入持久化文件時並不調用 flush，僅寫入 OS pagecache，後續由 OS ...

Kafka 應對場景：消息持久化、吞吐量是第一要求、狀態由客戶端維護、必須是分散式的。Kafka 認為 broker 不應該阻塞生產者，高效的磁碟順序讀寫能夠和網路 IO 一樣快，同時依賴現代 OS 文件系統特性，寫入持久化文件時並不調用 flush，僅寫入 OS pagecache，後續由 OS flush。

這些特性決定了 Kafka 沒有做“確認機制”，而是直接將生產消息順序寫入文件、消息消費後不刪除（避免文件更新），該實現充分利用了磁碟 IO，能夠達到較高的吞吐量。代價是消費者要依賴 Zookeeper 記錄隊列消費位置、處理同步問題。沒有消費確認機制，還導致了 Kafka 無法瞭解消費者速度，不能採用 push 模型以合理的速度向消費者推送數據，只能利用 pull 模型由消費者來拉消息（消費者承擔額外的輪詢開銷）。

消息生產分為同步模式和非同步模式
配置：https://www.cnblogs.com/the-tops/p/6046487.html
producer.type：消息發送類型同步還是非同步，預設為同步

消息確認分為三個狀態
(a)0：生產者只負責發送數據
(b)1：某個partition的leader收到數據給出響應
(c)-1：某個partition的所有副本都收到數據後給出響應
在同步模式下
(a)生產者等待10S，如果broker沒有給出ack響應，就認為失敗。
(b)生產者重試3次，如果還沒有響應，就報錯。
在非同步模式下
(a)先將數據保存在生產者端的buffer中。Buffer大小是2萬條。
(b)滿足數據閾值或者數量閾值其中的一個條件就可以發送數據。
(c)發送一批數據的大小是500條。
Kafka消息保證生產的信息不丟失和重覆消費問題
（1）使用同步模式的時候，有3種狀態保證消息被安全生產，在配置為1（只保證寫入leader成功）的話，如果剛好leader partition掛了，數據就會丟失。
（2）還有一種情況可能會丟失消息，就是使用非同步模式的時候，當緩衝區滿了，如果配置為0（還沒有收到確認的情況下，緩衝池一滿，就清空緩衝池裡的消息），
數據就會被立即丟棄掉。
在數據生產時避免數據丟失的方法：
（1）在同步模式的時候，確認機制設置為-1，也就是讓消息寫入leader和所有的副本。
（2）在非同步模式下，如果消息發出去了，但還沒有收到確認的時候，緩衝池滿了，在配置文件中設置成不限制阻塞超時的時間，也就說讓生產端一直阻塞，這樣也能保證數據不會丟失。

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

關於Bootstrap fileinput 上傳新文件，移除時觸發伺服器同步刪除的配置

在Bootstrap fileinput中移除預覽文件時可以通過配置initialPreviewConfig: [ { url:'deletefile',key:fileid } ] 來同步刪除伺服器上的文件和記錄。但新上傳的文件則需要其他方式來同步刪除伺服器記錄。在配置中遇到的一些問題，記錄一下 ...
小程式解決方案 Westore - 組件、純組件、插件開發

數據流轉先上一張圖看清 Westore 怎麼解決小程式數據難以管理和維護的問題: 非純組件的話，可以直接省去 triggerEvent 的過程，直接修改 store.data 並且 update，形成縮減版單向數據流。 "Github: https://github.com/dntzhang/we ...
因特爾黑科技：黑暗中快速成像系統

想在黑暗中看清周圍，不可避免地要用到夜視儀。那麼如果是想在黑暗中拍照，又沒有閃光燈，如何才能排到清晰的照片？在CVPR 2018上，英特爾實驗室的Vladlen Koltun和陳啟峰帶領的團隊提出了一種在黑暗中快速成像的系統，效果非常贊。在暗光下的圖像易受到低信噪比和低亮度的影響。短曝光的照片會出 ...
dubbo+zipkin調用鏈監控(二)

去年的時候寫過dubbo+zipkin調用鏈監控,最近看到zipkin2配合brave實現起來會比我之前的實現要簡單很多，因為brave將很多交互的內容都封裝起來了，不需要自己去寫具體的實現，比如如何去構建span，如何去上報數據。收集器抽象由於zipkin支持http以及kafka兩種方式上報 ...
使用Consul做服務發現的若幹姿勢

這兩年微服務越來越火，使用Consul的人也越來越多，這篇文章將結合Consul的官方文檔和自己的實際經驗，談一下Consul做服務發現的方式，文中儘量不依賴具體的框架和開發語言，從原理上進行說明，希望能夠講清楚幾個問題。 ...
HRMS(人力資源管理系統)-SaaS架構設計-概要設計實踐

前期我們針對架構準備階段及需求分析這塊我們寫了2篇內容《HRMS(人力資源管理系統)-從單機應用到SaaS應用-架構分析(功能性、非功能性、關鍵約束)-上篇》《HRMS(人力資源管理系統)-從單機應用到SaaS應用-架構分析(功能性、非功能性、關鍵約束)-下篇》內容來展開說明。本篇... ...
分散式緩存架構設計

零、題記在高併發場景下，需要通過緩存來減少資料庫的壓力，使得大量的訪問進來能夠命中緩存，只有少量的需要到資料庫層。由於緩存基於記憶體，可支持的併發量遠遠大於基於硬碟的資料庫。所以對於高併發設計，緩存的設計是必不可少的一環。一、為什麼要使用緩存為什麼要使用緩存呢？源於人類的一個夢想，就是多快好省的 ...
分散式系統關註點——僅需這一篇，吃透「負載均衡」妥妥的

本文長度為3426字，預計讀完需1.2MB流量，建議閱讀9分鐘。閱讀目錄「負載均衡」是什麼？常用「負載均衡」策略圖解常用「負載均衡」策略優缺點和適用場景用「健康探測」來保障高可用結語「負載均衡」是什麼？常用「負載均衡」策略圖解常用「負載均衡」策略優缺點和適用場景用「健康探測」來保 ...