Kafka入門初探+偽集群部署

来源:http://www.cnblogs.com/xing901022/archive/2016/08/02/5730358.html
-Advertisement-
Play Games

Kafka是目前非常流行的消息隊列中間件,常用於做普通的消息隊列、網站的活性數據分析(PV、流量、點擊量等)、日誌的搜集(對接大數據存儲引擎做離線分析)。 全部內容來自網路,可信度有待考證!如有問題,還請及時指正。 概念介紹 在Kafka中消息隊列分為三種角色: ,即生產者,負責產生日誌數據。 ,存 ...


Kafka是目前非常流行的消息隊列中間件,常用於做普通的消息隊列、網站的活性數據分析(PV、流量、點擊量等)、日誌的搜集(對接大數據存儲引擎做離線分析)。

全部內容來自網路,可信度有待考證!如有問題,還請及時指正。

概念介紹

在Kafka中消息隊列分為三種角色:

  • producer,即生產者,負責產生日誌數據。
  • broker,存儲節點,負責按照topic中的partition分區,均勻分散式的存儲分區。
  • consumer,即消費者,負責讀取使用broker中的分區。

producer

Kafka系統中的生產者,用於產生數據併發送給broker進行存儲。由於需要與broker中的分區保持socket連接,因此需要在zk中維護生產者與分區broker的對應關係。同一個topic下的數據,會以某種負載均衡的方式發送到不同的分區中。

broker

Broker可以當做Kafka中的存儲節點,數據按照topic組織,按照某種負載均衡方式分配到不同的分區中。一個Topic由多個分區組成,每個分區可以設置備份數量。分區由一個leader+多個followers組成,生產者直接與leader進行溝通,leader接收消息後,其他的followers會同步這個消息。所有的follwers同步消息後,該消息才會成為可消費的狀態。

Broker中Topic與分區,分區與生產者,分區之間的選舉備份等等信息都需要ZK進行協調。

consumer

Consumer是Kafka中的消費者,通常以組的形式存在,一個Group會包含多個Consumer。每個組對應一個Topic,該Topic內的分區只能對應一個消費者,也就是如果消費者很多的情況下,會出現有的消費者消費不到數據;如果消費者很少的情況下,會有消費者同時消費多個分區的數據。

Kafka僅僅會保證一個分區的消息的消費是有序的,多個分區並不保證有序性。

為了保證數據消費的可靠性,Kakka提供了幾種消費的機制:

  • 1 at most once,即消費數據後,保存offset,就再也取不到這個數據了。
  • 2 at least once,即消費數據後,保存offset,如果保存出錯,下次可能還會取到該數據
  • 3 exactly once,待查閱

在Kafka中offset是由consumer維護的(實際可以由zk來完成)。這種機制有兩個好處,

  • 一個是可以依據consumer的能力來消費數據,避免產生消費數據的壓力;
  • 另一個就是可以自定義fetch消費的數據數目,可以一次讀取1條,也可以1次讀取100條。

topic

Kafka中的數據的主題,所有的操作(如消息的存儲和讀取\消費)都是依據topic完成。

partition

每個Topic由多個分區組成,每個分區內部的數據保證了有序性,即是按照時間序列,append到分區的尾部。分區是有固定大小的,容量不夠時,會創建新的分區。Kafka在一定時間內會定期清理過期的文件。

這種連續性的文件存儲,一方面有效的利用磁碟的線性存取;另一方面減輕了記憶體的壓力。

zookeeper

在Kafka中很多節點的調度以及資源的分配,都要依賴於zookeeper來完成。
如:

  • 1 Broker的註冊,保存Broker的IP以及埠;
  • 2 Topic註冊,管理broker中Topic的分區以及分佈情況
  • 3 Broker的負載均衡,講Topic動態的分配到broker中,通過topic的分佈以及broker的負載判斷
  • 4 消費者,每個分區的消息僅發送給一個消費者(不知道跟zookeeper有啥關係)
  • 5 消費者與分區的對應關係,存儲在zk中
  • 6 消費者負載均衡,一旦消費者增加或者減少,都會觸發消費者的負載均衡
  • 7 消費者的offset,High level中由zk維護offset的信息;Low Level中由自己維護offset

偽集群環境的搭建

部署偽集群環境,即單節點環境非常簡單。下載部署文件,解壓後,直接運行即可。

運行命令如下:

# 啟動zookeeper
bin/zookeeper-server-start.sh config/zookeeper.properties &  

# 啟動kafka
bin/kafka-server-start.sh config/server.properties &  

如果想要測試,可以啟動測試程式:

# 啟動生產者測試程式
./kafka-console-producer.sh --broker-list localhost:9092 --topic test

# 啟動消費者測試程式
./kafka-console-consumer.sh --zookeeper localhost:2181 --topic test --from-beginning

在生產者界面輸入的內容,就可以直接在消費者界面中看到了。


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 首先進入mysql:mysql -u root -p 1.建庫: create database 庫名稱; 例如:create database mydata;(創建一個名為“mydata”的庫); 2.建表: use 要存表的庫名稱; create table 表名稱(欄位設定列表); 例如:us ...
  • Redis is an open source (BSD licensed), in-memory data structure store, used as database, cache and message broker. It supports data structures such a ...
  • 在初始化MySQL的過程中經常會碰到各種問題,如 出現這些問題的原因無非是兩種, 1> 沒有傳遞合適的參數。 譬如: [root@localhost ~]# /usr/test/mariadb-10.1.16-linux-x86_64/scripts/mysql_install_db --datad ...
  • 我們這裡先給出題和結果吧,該題目是剛纔從網上看到的,很多朋友會問這個答案不是有嗎?錯,如果仔細看差別就大了,不多說了直接進入主題吧: 這就是我們要做到的,我接下來給出三種方法吧: 方法一: 我們一看明顯可以看出方法一代碼量太大了,不適用由於我就找到了方法二,我對他代碼進行組合了可以得到以下方法: 方 ...
  • 這段時間遇到一個問題就是ReportService 中採用了遠程連接的報表偶爾會斷開連接,導致報表導出異常,查閱了很多資料,幾天來就是斷斷續續的終於解決了這個問題,下麵把一些解決的點一一展示出來,便於大家將來遇到同樣問題無從下手。 首先是報錯,接下來我馬上去看日誌,很多人不知道文件的位置,一般預設就 ...
  • 成功安裝了Oracle 11g後,使用sqlplus登錄資料庫時遇到下麵錯誤: [oracle@DB-Server ~]$ sqlplus / as sysdba sqlplus: error while loading shared libraries: /u01/app/lib/libclnts... ...
  • 計算string所占的位元組長度:返回字元串的長度,單位是 計算string所占的字元長度:返回字元串的長度,單位是 eg: //去掉該欄位後面15位字元串 select t.depre_name, substr(t.depre_name, 0, (length(t.depre_name) 16)) ...
  • 一. 創建表的方法 語法:create table 表名( 屬性名數據類型完整約束條件, 屬性名數據類型條完整約束件, 。。。。。。。。。 屬性名數據類型 ); (1)舉例:1 create table example0( 2 id int, 3 name varchar(20), 4 sexboo ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...