Kafka與Logstash的數據採集對接 —— 看圖說話，從運行機制到部署

-Advertisement-

基於Logstash跑通Kafka還是需要註意很多東西，最重要的就是理解Kafka的原理。 Logstash工作原理由於Kafka採用解耦的設計思想，並非原始的發佈訂閱，生產者負責產生消息，直接推送給消費者。而是在中間加入持久化層——broker,生產者把數據存放在broker中，消費者從brok ...

基於Logstash跑通Kafka還是需要註意很多東西，最重要的就是理解Kafka的原理。

Logstash工作原理

由於Kafka採用解耦的設計思想，並非原始的發佈訂閱，生產者負責產生消息，直接推送給消費者。而是在中間加入持久化層——broker,生產者把數據存放在broker中，消費者從broker中取數據。這樣就帶來了幾個好處:

1 生產者的負載與消費者的負載解耦
2 消費者按照自己的能力fetch數據
3 消費者可以自定義消費的數量

另外，由於broker採用了主題topic-->分區的思想，使得某個分區內部的順序可以保證有序性，但是分區間的數據不保證有序性。這樣，消費者可以以分區為單位，自定義讀取的位置——offset。

Kafka採用zookeeper作為管理，記錄了producer到broker的信息，以及consumer與broker中partition的對應關係。因此，生產者可以直接把數據傳遞給broker，broker通過zookeeper進行leader-->followers的選舉管理；消費者通過zookeeper保存讀取的位置offset以及讀取的topic的partition分區信息。

由於上面的架構設計，使得生產者與broker相連；消費者與zookeeper相連。有了這樣的對應關係，就容易部署logstash-->kafka-->logstash的方案了。

接下來，按照下麵的步驟就可以實現logstash與kafka的對接了。

啟動kafka

啟動zookeeper：

$zookeeper/bin/zkServer.sh start

啟動kafka：

$kafka/bin/kafka-server-start.sh $kafka/config/server.properties &

創建主題

創建主題:

$kafka/bin/kafka-topics.sh --zookeeper 127.0.0.1:2181 --create --topic hello --replication-factor 1 --partitions 1

查看主題:

$kafka/bin/kafka-topics.sh --zookeeper 127.0.0.1:2181 --describe

測試環境

執行生產者腳本:

$kafka/bin/kafka-console-producer.sh --broker-list 10.0.67.101:9092 --topic hello

執行消費者腳本，查看是否寫入:

$kafka/bin/kafka-console-consumer.sh --zookeeper 127.0.0.1:2181 --from-beginning --topic hello

輸入測試

input{
    stdin{}
}
output{
    kafka{
        topic_id => "hello"
        bootstrap_servers => "192.168.0.4:9092" # kafka的地址
        batch_size => 5
    }
    stdout{
        codec => rubydebug
    }
}

讀取測試

logstash配置文件:

input{
    kafka {
        codec => "plain"
        group_id => "logstash1"
        auto_offset_reset => "smallest"
        reset_beginning => true
        topic_id => "hello"
        #white_list => ["hello"]
        #black_list => nil
        zk_connect => "192.168.0.5:2181" # zookeeper的地址
   }

}
output{
    stdout{
        codec => rubydebug
    }
}

您的分享是我們最大的動力!

-Advertisement-

更多相關文章

微信Demo導入遇到的問題

最近做支付寶和微信接入自己APP工程的功能，遇到了一些問題，跟大家分享：這裡先說Android開發微信支付接入。首先根據官方文檔進行，對比支付寶的官方文檔，微信部分更顯得“摘要”一些。導入後自行觸發的Gradle Build無法通過，提示需要Android Build Tool 22，所以又安 ...
Android任務棧的運行規律

...
android下麵res目錄

1. 相關文件夾介紹在Android項目文件夾裡面，主要的資源文件是放在res文件夾裡面的。assets文件夾是存放不進行編譯加工的原生文件，即該文件夾裡面的文件不會像xml，java文件被預編譯，可以存放一些圖片，html，js, css等文件。在後面會介紹如何讀取assets文件夾的資源！ r ...
偏移64

// self.automaticallyAdjustsScrollViewInsets = NO; // // self.edgesForExtendedLayout = UIRectEdgeNone; ...
Android開發中使用七牛雲存儲進行圖片上傳下載

Android開發中的圖片存儲本來就是比較耗時耗地的事情，而使用第三方的七牛雲，便可以很好的解決這些後顧之憂，最近我也是在學習七牛的SDK，將使用過程在這記錄下來，方便以後使用。先說一下七牛雲的存儲原理，上面這幅圖片是官方給出的原理圖，表述當然比較清晰了。可以看出，要進行圖片上傳的話可以分為五大步 ...
GCD封裝的個人理解和應用

GCD封裝的個人理解和應用特點 >>將GCD封裝,使我們從繁瑣的方法記憶中解脫出來,能夠直接快速的應用. 使用方法 1.將工程中的GCD文件中的9個文件拖入自己的工程中(你自己最好建一個文件夾,用來保存這幾個文件,方便管理!). 2.在所要用到GCD的view中,導入GCD.h文件 3.封裝的GC ...
mysql顛覆實戰筆記(五)--商品系統設計(二):定時更新商品總點擊量

繼續回到沈老師的MYSQL顛覆實戰，首先回顧下上一節課的內容，請大家會看下上節課寫的存儲過程。打開prod_clicklog表，我們只要把日期（不含時分秒）的部分存在資料庫中，如果同一日期有相同用戶點擊商品，那麼我們對其數值+1，否則的話，這張點擊日誌表會過於龐大下麵我們將prod_clic ...
【故障處理】分散式事務ORA-01591錯誤解決

【故障處理】分散式事務ORA-01591錯誤解決 1 BLOG文檔結構圖 2 前言部分 2.1 導讀和註意事項各位技術愛好者，看完本文後，你可以掌握如下的技能，也可以學到一些其它你所不知道的知識，~O(∩_∩)O~： ① 分散式事務的簡單概念 ② ORA-01591錯誤解決 Tips： ① 本文在... ...