面試題百日百刷-kafka篇(四)_ZenDei技術網路在線

面試題百日百刷-kafka篇(四)

-Advertisement-

**鎖屏面試題百日百刷，每個工作日堅持更新面試題。**請看到最後就能獲取你想要的, 接下來的是今日的面試題： 1.為什麼kafka可以實現高吞吐？單節點kafka的吞吐量也比其他消息隊列大，為什麼？ Kafka是分散式消息系統，需要處理海量的消息，Kafka的設計是把所有的消息都寫入速度低容量大的硬 ...

鎖屏面試題百日百刷，每個工作日堅持更新面試題。****請看到最後就能獲取你想要的, 接下來的是今日的面試題：

1.為什麼kafka可以實現高吞吐？單節點kafka的吞吐量也比其他消息隊列大，為什麼？

Kafka是分散式消息系統，需要處理海量的消息，Kafka的設計是把所有的消息都寫入速度低容量大的硬碟，以此來換取更強的存儲能力，但實際上，使用硬碟並沒有帶來過多的性能損失。kafka主要使用了以下幾個方式實現了超高的吞吐率

順序讀寫

kafka的消息是不斷追加到文件中的，這個特性使kafka可以充分利用磁碟的順序讀寫性能順序讀寫不需要硬碟磁頭的尋道時間，只需很少的扇區旋轉時間，所以速度遠快於隨機讀寫

零拷貝

先簡單瞭解下文件系統的操作流程，例如一個程式要把文件內容發送到網路,這個程式是工作在用戶空間，文件和網路socket屬於硬體資源，兩者之間有一個內核空間在操作系統內部，整個過程為：

在Linux kernel2.2 之後出現了一種叫做”零拷貝(zero-copy)”系統調用機制，就是跳過“用戶緩衝區”的拷貝，建立一個磁碟空間和記憶體的直接映射，數據不再複製到“用戶態緩衝區”系統上下文切換減少為2次，可以提升一倍的性能

文件分段

kafka的隊列topic被分為了多個區partition，每個partition又分為多個段segment，所以一個隊列中的消息實際上是保存在N多個片段文件中通過分段的方式，每次文件操作都是對一個小文件的操作，非常輕便，同時也增加了並行處理能力

批量發送

Kafka允許進行批量發送消息，先將消息緩存在記憶體中，然後一次請求批量發送出去比如可以指定緩存的消息達到某個量的時候就發出去，或者緩存了固定的時間後就發送出去如100條消息就發送，或者每5秒發送一次這種策略將大大減少服務端的I/O次數

數據壓縮

Kafka還支持對消息集合進行壓縮，Producer可以通過GZIP或Snappy格式對消息集合進行壓縮壓縮的好處就是減少傳輸的數據量，減輕對網路傳輸的壓力Producer壓縮之後，在Consumer需進行解壓，雖然增加了CPU的工作，但在對大數據處理上，瓶頸在網路上而不是CPU，所以這個成本很值得

2.Kafka的ISR

ISR代表In-Sync Replicas，在Kafka里表示目前處於同步狀態的那些副本（replica）。

Kafka規定一條消息只有當ISR中所有的副本都複製成功時，才能被消費。

全部內容在git上,瞭解更多請點我頭像或到我的主頁去獲得，謝謝

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

談一談Python中的裝飾器

說明使用 VLD 記憶體泄漏檢測工具輔助開發時整理的學習筆記。同系列文章目錄可見《記憶體泄漏檢測工具》目錄 1. 使用方式在 VS 中使用 VLD 的方法可以查看另外一篇博客：在 VS 2015 中使用 VLD。 2. 輸出報告在 VS 中使用 VLD 時的輸出報告，與在 QT 中使用時是一致的 ...
abp(net core)+easyui+efcore實現倉儲管理系統——模塊管理升級之上(六十一)

.NET 實現JWT登錄認證在ASP.NET Core應用程式中，使用JWT進行身份驗證和授權已成為一種流行的方式。JWT是一種安全的方式，用於在客戶端和伺服器之間傳輸用戶信息。添加NuGet包首先，我們需要添加一些NuGet包來支持JWT身份驗證。在您的ASP.NET Core項目中，打開S ...
Linux：管道命令與文本處理三劍客（grep、sed、awk）

眾所周知，bash命令執行的時候會輸出信息，但有時這些信息必須要經過幾次處理之後才能得到我們想要的格式，此時應該如何處置？這就牽涉到管道命令(pipe) 了。管道命令使用的是|這個界定符號。每個管道後面接的第一個數據必定是命令，而且這個命令必須要能夠接受標準輸出的數據才行，這樣的命令才可為管道命令... ...
docker部署gitlab CI/CD （一）第一篇：部署gitlab及漢化

考點：文件的打開和讀取打開文件的過程：打開操作本質上是使用了open這個系統調用，參數如下圖所示。操作系統通過文件的路徑在外存中找到了這個test.txt文件所在的目錄，繼續找該文件的目錄項（FCB），一個文件只有一個目錄項。然後將這個目錄項調到記憶體中，系統中有一個系統打開文件表，裡面存放的是 ...
Windows10提升效率小Tips

資源管理器右鍵添加打開cmd視窗指令資源管理器空白處右鍵添加打開cmd視窗命令，直接打開cmd並切換到當前目錄首先刪除該指令添加該指令條目、名稱，然後添加具體的指令此.reg文件必須以UTF-8-BOM編碼格式保存，否則無法設置中文名稱 Windows Registry Editor Ver ...
linux vi命令詳解

linux vi命令詳解剛開始學著用linux，對vi命令不是很熟，在網上轉接了一篇。 vi編輯器是所有Unix及Linux系統下標準的編輯器，它的強大不遜色於任何最新的文本編輯器，這裡只是簡單地介紹一下它的用法和一小部分指令。由於對Unix及Linux系統的任何版本，vi編輯器是完全相同的， ...
[apue] 一圖讀懂 Unix 時間日期常式相互關係

GMT 和 UTC 時間有何區別？Unix 時間常式為何不處理閏秒？系統時區是如何設置的？哪些時間常式受夏時制影響？localtime 和 gmtime 是否共用內部存儲區？strftime 獲取第幾周使用的 %U/%V/%W 有何區別？linux date 和 mac date 語法有何區別？本文... ...
Redis 報”OutOfDirectMemoryError“（堆外記憶體溢出)

Redis 報錯“OutOfDirectMemoryError（堆外記憶體溢出) ”問題如下：一、報錯信息：使用 Redis 的業務介面，產生 OutOfDirectMemoryError（堆外記憶體溢出），如圖：格式化後的報錯信息： { "timestamp": "2023-04-17 22: ...