簡單易用的任務隊列-beanstalkd

来源:https://www.cnblogs.com/immaxfang/archive/2022/07/21/16503956.html
-Advertisement-
Play Games

概述 beanstalkd 是一個簡單快速的分散式工作隊列系統,協議基於 ASCII 編碼運行在 TCP 上。其最初設計的目的是通過後臺非同步執行耗時任務的方式降低高容量 Web 應用的頁面延時。其具有簡單、輕量、易用等特點,也支持對任務優先順序、延時/超時重發等控制,同時還有眾多語言版本的客戶端支持, ...


概述

beanstalkd 是一個簡單快速的分散式工作隊列系統,協議基於 ASCII 編碼運行在 TCP 上。其最初設計的目的是通過後臺非同步執行耗時任務的方式降低高容量 Web 應用的頁面延時。其具有簡單、輕量、易用等特點,也支持對任務優先順序、延時/超時重發等控制,同時還有眾多語言版本的客戶端支持,這些優點使得它成為各種需要隊列系統場景的一種常見選擇。

beanstalkd 優點

  • 如他官網的介紹,simple&fast,使用非常簡單,適合需要引入消息隊列又不想引入 kafka 這類重型的 mq,維護成本低;同時,它的性能非常高,大部分場景下都可以 cover 住。
  • 支持持久化
  • 支持消息優先順序,topic,延時消息,消息重試等
  • 主流語言客戶端都支持,還可以根據 beanstalkd 協議自行實現。

beanstalkd 不足

  • 無最大記憶體控制,當業務消息極多時,服務可能會不穩定。
  • 官方沒有提供集群故障切換方案(主從或哨兵等),需要自己解決。

beanstalkd 重點概念

  • job

任務,隊列中的基本單元,每個 job 都會有 id 和優先順序。有點類似其他消息隊列中的 message 的概念。但 job 有各種狀態,下文介紹生命周期部分會重點介紹。job 存放在 tube 中。

  • tube

管道,用來存儲同一類型的 job。有點類似其他消息隊列中的 topic 的概念。beanstalkd 通過 tube 來實現多任務隊列,beanstalkd 中可以有多個管道,每個管道有自己的 producer 和 consumer,管道之間互相不影響。

  • producer

job 生產者。通過 put 命令將一個 job 放入到一個 tube 中。

  • consumer

job 消費者。通過 reserve 來獲取 job,通過 delete、release、bury 來改變 job 的狀態。

beanstalkd 生命周期

上文介紹到,beanstalkd 中 job 有狀態區分,在整個生命周期中,job 可能有四種狀態:READY, RESERVED, DELAYED, BURIED。只有處於READY狀態的 job 才能被消費。下圖介紹了各狀態之間的流轉情況。

beanstalkd-status

producer 在創建 job 的時候有兩種方式,put 和 put with delay(延時任務)。
如果 producer 使用 put 直接創建一個 job 時,該 job 就處於 READY 狀態,等待 consumer 處理。
如果 producer 使用 put with delay 方式創建 job,該 job 的初始狀態為 DELAYED 狀態,等待延遲時間過後才變更為 READY 狀態。
以上兩種方式創建的 job 都會傳入一個 TTR(超時機制),當 job 處於 RESERVED 狀態時,TTR 開始倒計時,當 TTR 倒計時完,job 狀態還沒有改變,則會認為該 job 處理失敗,會被重新放回到隊列中。

consumer 獲取到(reserve)一個 READY 狀態的 job 之後,該 job 的狀態就會變更為 RESERVED。此時,其他的 consumer 就不能再操作該 job 了。當 consumer 完成該 job 之後,可以選擇 delete,release,或 bury 操作。

  • delete ,job 被刪除,從 beanstalkd 中清除,以後也無法再獲取到,生命周期結束。
  • release ,可以把該 job 重新變更為 READY 狀態,使得其他的 consumer 可以繼續獲取和執行該 job,也可以使用 release with delay 延時操作,這樣會先進入 DELAYED 狀態,延遲時間到達後再變為 READY。
  • bury,可以將 job 休眠,等需要的時候,在將休眠的 job 通過 kick 命令變更回 READY 狀態,也可以通過 delete 直接刪除 BURIED 狀態的 job 。

處於 BURIED 狀態的 job,可以通過 kick 重回 READY 狀態,也可以通過 delete 刪除 job。

為什麼設計這個 BURIED 狀態呢?
一般我們可以用這個狀態來做異常捕獲,例如執行超時或者異常的 job,我們可以將其置為 BURIED 狀態,這樣做有幾個好處:
1.可以便面這些異常的 job 直接被放回隊列重試,影響正常的隊列消費(這些失敗一次的 job,很有可能再次失敗)。如果沒有這個 BURIED 狀態,如果我們要單獨隔離,一般我們會使用一個新的 tube 單獨存放這些異常的 job,使用單獨的 consumer 消費。這樣就不會影響正常的新消息消費。特別是失敗率比較高的時候,會占用很多的正常資源。
2.便於人工排查,上面已經講到,可以將異常的 job 置為 BURIED 狀態,這樣人工排查時重點關註這個狀態就可以了。

beanstalkd 特性

持久化

通過 binlog 將 job 及其狀態記錄到本地文件,當 beanstalkd 重啟時,可以通過讀取 binlog 來恢復之前的 job 狀態。

分散式

在 beanstalkd 的文檔中,其實是支持分散式的,其設計思想和 Memcached 類似,beanstalkd 各個 server 之間並不知道彼此的存在,是通過 client 實現分散式以及根據 tube 名稱去特定的 server 上獲取 job。貼一篇專門討論 beanstalkd 分散式的文章,Beanstalkd的一種分散式方案

任務延時

天然支持延時任務,可以在創建 job 時指定延時時間,也可以當 job 被處理完後才能後,消費者使用 release with delay 將 job 再次放入隊列延時執行。

任務優先順序

producer 生成的 job 可以給他分配優先順序,支持 0 到 2^32 的優先順序,值越小,優先順序越高,預設優先順序為 1024。優先順序高的 job 會被 consumer 優先執行。

超時機制

為了防止某個 consumer 長時間占用 job 但無法處理完成的情況,beanstalkd 的 reserve 操作支持設置 timeout 時間(TTR)。如果 consumer 不能在 TTR 內發送 delete、release 或 bury 命令改變 job 狀態,那麼 beanstalkd 會認為任務處理失敗,會將 job 重新置為 READY 狀態供其他 consumer 消費。
如果消費者已經預知可能無法在 TTR 內完成該 job,則可以發送 touch 命令,使得 beanstalkd 重新計算 TTR。

任務預留

有一個 BURIED 狀態可以作為緩衝,具體特點見上文生命周期中關於 BURIED 狀態的介紹。

安裝及配置

以下以 ubuntu 為例,安轉 beanstalkd:

sudo apt-get update
sudo apt-get install beanstalkd
vi /etc/sysconfig/beanstalkd
# 添加如下內容
BEANSTALKD_BINLOG_DIR=/data/beanstalkd/binlog

可以通過 beanstalkd 命令來運行服務,並且可以添加多種參數。命令的格式如下:

beanstalkd [OPTIONS]

 -b DIR   wal directory
 -f MS    fsync at most once every MS milliseconds (use -f0 for "always fsync")
 -F       never fsync (default)
 -l ADDR  listen on address (default is 0.0.0.0)
 -p PORT  listen on port (default is 11300)
 -u USER  become user and group
 -z BYTES set the maximum job size in bytes (default is 65535)
 -s BYTES set the size of each wal file (default is 10485760)
            (will be rounded up to a multiple of 512 bytes)
 -c       compact the binlog (default)
 -n       do not compact the binlog
 -v       show version information
 -V       increase verbosity
 -h       show this help

如下我們啟動一個 beanstalkd 服務,並開啟 binlog:

nohup beanstalkd -l 0.0.0.0 -p 11300 -b /data/beanstalkd/binlog/ &

beanstalkd管理工具

官方推薦的一些管理工具:Tools
筆者常用的管理工具:https://github.com/ptrofimov/beanstalk_console
如果只是簡單的操作和查看 beanstalkd,可以使用 telnet 工具,然後執行 stats,use,put,watch 等:

$ telnet 127.0.0.1 11300
stats

實際應用

beansralkd 有很多語言版本的客戶端實現,官方提供了一些客戶端列表beanstalkd客戶端列表
如果現有的這些庫不滿足需求,也可以自行實現,參考 beanstalkd協議

以下以 go 為例,簡單演示下 beanstalkd 常用處理操作。

go get github.com/beanstalkd/go-beanstalk

生產者

向預設的 tube 中投入 job:

id, err := conn.Put([]byte("myjob"), 1, 0, time.Minute)
if err != nil {
	panic(err)
}
fmt.Println("job", id)

向指定的 tube 中投入 job:

tube := &beanstalk.Tube{Conn: conn, Name: "mytube"}
id, err := tube.Put([]byte("myjob"), 1, 0, time.Minute)
if err != nil {
	panic(err)
}
fmt.Println("job", id)

消費者

消費預設的 tube 中的 job:

id, body, err := conn.Reserve(5 * time.Second)
if err != nil {
	panic(err)
}
fmt.Println("job", id)
fmt.Println(string(body))

消費指定的 tube (此處指定多個) 中的 job:

tubeSet := beanstalk.NewTubeSet(conn, "mytube1", "mytube2")
id, body, err := tubeSet.Reserve(10 * time.Hour)
if err != nil {
	panic(err)
}
fmt.Println("job", id)
fmt.Println(string(body))

beanstalkd 使用小 tips

  • 可以通過指定 tube ,在 put 的時候將 job 放入指定的 tube 中,否則會放入 default 的 tube 中。
  • beanstalkd 支持持久化,在啟動時使用 -b參數來開啟binlog,通過binog可以將 job 及其狀態記錄到文件里。當重新使用-b參數重啟 beanstalkd,將讀取binlog來恢復之前的 job 及狀態。

參考資料


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 原文地址:Kotlin學習快速入門(8)—— 屬性委托 - Stars-One的雜貨小窩 委托其實是一種設計模式,但Kotlin把此特性編寫進了語法中,可以方便開發者快速使用 委托對應的關鍵字是by 屬性委托 先講下屬性委托吧,首先,複習下kotlin中設置set和get方法 預設的set和get我 ...
  • 華為應用內支付服務(In-App Purchases)通過簡便的接入流程為用戶提供良好的應用內支付體驗,然而在實際接入過程中,有一些開發者反饋測試時會無法正常拉起支付頁面,下文將詳細分析問題出現的5種情形,並給出解決方案,希望給遇到類似問題的開發者提供參考。 情形1:AGC控制臺上API管理中的支付 ...
  • JavaScript進階內容——BOM詳解 在上一篇文章中我們學習了DOM,接下來讓我們先通過和DOM的對比來簡單瞭解一下BOM 首先我們先來複習一下DOM: 文檔對象模型 DOM把文檔當作一個對象來看待 DOM的頂級對象是document DOM的主要學習是操作頁面元素 DOM是W3C標準規範 然 ...
  • 這裡給大家分享我在網上總結出來的一些知識,希望對大家有所幫助 一、Git 1. git 和 svn 的區別 git 和 svn 最大的區別在於 git 是分散式的,而 svn 是集中式的。因此我們不能再離線的情況下使用 svn。如果伺服器出現問題,就沒有辦法使用 svn 來提交代碼。 svn 中的分 ...
  • ES6 class中的一些問題 記錄下class中的原型,實例,super之間的關係 //父類 class Dad { constructor(x, y) { this.x = 5; this.y = 1; this.state = 789 } static x = 521 state1 = 666 ...
  • 在早期的隨筆就介紹過,把常規頁面的內容拆分為幾個不同的組件,如普通的頁面,包括列表查詢、詳細資料查看、新增資料、編輯資料、導入資料等頁面場景,這些內容相對比較獨立,而有一定的代碼量,本篇隨筆介紹基於Vue3+Typescript+Setup語法方式,來拆分頁面模塊內容為組件,實現分而治之的處理。 ...
  • @(文章目錄) 提示:本文僅供學習交流,請勿用於非法活動! 前言 本文大概內容: 在官網展現圖表及報表(含導出) 一、使用highcharts前後端交互展示圖表,及使用報表導出 如下圖,我們在首頁如何將折線圖、柱狀圖結合報表,並實現根據不同的倉庫實時刷新不同的數據,最後可以選擇導出圖表及報表。 二、 ...
  • JavaScript進階內容——DOM詳解 當我們已經熟練掌握JavaScript的語法之後,我們就該進入更深層次的學習了 首先我們思考一下:JavaScript是用來做什麼的? JavaScript誕生就是為了能夠讓它在瀏覽器中運行 那麼DOM就是我們學習中不可或缺的一個環節,下麵讓我們深入瞭解D ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...