DolphinScheduler 3.3.0版本更新一覽

来源:https://www.cnblogs.com/DolphinScheduler/p/18208715
-Advertisement-
Play Games

Apache DolphinScheduler即將迎來3.3.0版本的發佈,屆時將有一系列重要的更新和改進。在近期的社區5月份用戶線上分享會上,項目PMC 阮文俊為大家介紹了3.3.0版本將帶來的主要更新和改進,併為大家指出瞭如何參與社區的方式。 什麼是DolphinScheduler? Dolph ...


Apache DolphinScheduler即將迎來3.3.0版本的發佈,屆時將有一系列重要的更新和改進。在近期的社區5月份用戶線上分享會上,項目PMC 阮文俊為大家介紹了3.3.0版本將帶來的主要更新和改進,併為大家指出瞭如何參與社區的方式。

什麼是DolphinScheduler?

DolphinScheduler是一個開源的項目,主要用來進行工作流編排、運行和管理。
它有四個重要的特點:

  • 工作流是基本單位,所有的功能設計都是圍繞工作流
  • 這是一個低代碼平臺,可以不用代碼,或用少量的代碼來完成工作流相關的工作
  • 不用數據遷移即可進行伺服器節點的擴縮容
  • 採用插件化架構

工作流是基本單位

  • 工作流可以包含任務和子工作流,每個任務都需要屬於一個工作流。
  • 工作流可以依賴其他工作流,工作流是最小的執行單元。
  • 工作流的執行支持手動或自動觸發。

file

無/低代碼操作

  • 可以在UI門戶,通過頁面托拉拽的交互方式完成工作流的定義和管控操作;
  • 也可以通過OpenAPI或PyDolphinScheduler來完成對工作流的相關操作。

file
file

無需數據遷移進行擴縮容

  • 元數據存儲在共用的關係資料庫中,無需數據遷移即可擴展系統。
  • 服務上線時自動註冊到集群,服務下線時,運行中的任務自動轉移,無需人工介入。

file

file

插件化架構

  • 工作流引擎之外的組件以插件形式實現。
  • 報警插件:Email、Http、微信、Slack等
  • 任務插件:Shell, SQL, Spark, K8s等
  • 數據源插件:Mysql, PG, Oracle等
  • 支持Zookeeper、JDBC、ETCD作為註冊中心
  • 支持HDFS、S3、OSS等存儲系統

接下來看一下3.3.0版本中有哪些新的變化。

3.3.0版本更新一覽

架構更新

3.3.0版本在整體架構和部署方式上沒有太大的變化,依然是三個核心服務:API主要用來做一些源數據的管理和授權方面的事情,Master主要是用來做工作流的編排和執行,Worker主要用來做任務的執行和管控。大部份核心組件通過插件的方式被載入。

file

新版中的一些重大變化包括:

新的任務插件介面

之前的版本在任務插件定義上有著如下問題:

  • 任務插件中的方法與生命周期不匹配,在任務插件定義上沒有暴露生命周期的方法,導致任務插件實現時會缺失,暫停、容錯等控制方法。。
  • 目前的任務插件介面過於複雜,任務插件介面包含很多子插件的方法,導致任務插件介面越來越膨脹。

3.3.0版本將引入新的任務插件定義介面(V2版本)來管理任務插件實例的生命周期。任務插件實例的生命周期管理包括運行、暫停、殺死、容錯、成功和失敗狀態。

新的任務插件介面會更加清晰明瞭:

file

  • 增加ITaskApplicationContext:表示任務插件實例運行的上下文信息,例如 processId、applicationId
  • 增加ITaskListenerManager:可以註冊用於偵聽任務插件實例的信息更改,便於對任務執行流程進行擴展

容錯改進

  • Master容錯:
    • 對下線的Master節點持有的工作流程進行容錯
    • 插入工作流容錯命令
    • 工作流容錯將從Worker伺服器接管正在運行的任務
  • Worker容錯:
    • 處理下線的Worker節點運行的任務
    • 把容錯任務分發給新的Worker節點
    • 不同的任務插件的容錯行為可能會不同
    • 支持精確一次(exactly-once)、至少一次(at-least-once)、至多一次(at-most-once)的容錯行為

file

參數優先順序統一

此前,DolphinScheduler中有多重參數類型,包括啟動參數、工作流定義參數、任務定義參數、租戶參數等,但存在的問題是這些參數沒有統一的優先順序,有些參數在運行時無法更改。
在3.3.0版本中,我們對參數優先順序進行了優化:

  • 統一了參數優先順序,遵循就近原則,如啟動參數 > 任務定義參數 > 工作流定義參數。
  • 啟動參數優先順序最高,其他參數可被啟動參數覆蓋,解決了參數優先順序不一致以及某些參數無法在運行時更改的問題。

工作流觸發解耦

目前,DolphinScheduler中所有工作流觸發都通過命令表示。目前的方式存在以下弊端:

  • 只能在資料庫中插入觸發命令,trigger與資料庫嚴格綁定
  • 沒有觸發命令的schema,難以擴展新的觸發

新版本對工作流觸發進行瞭解耦,並可以通過消息中間件來進行工作流觸發:

  • 提供了標準的Trigger schema,方便擴展trigger
  • 引入CommandEngine組件來探測待處理的命令
  • 命令的repository不再僅限於關係型資料庫,支持從流式系統(如Kafka)中消費命令

file

事件線程模型改進

當前,DolphinScheduler Master中存在兩個事件線程池,分別處理工作流事件和任務狀態變更事件。這樣的模型導致運行中很難協調這兩個線程池,而且事件的順序可能會丟失,並且用戶也很難去設置這兩個線程池的大小。

file

為了改變這一點,3.3.0中做了以下優化:

  • 合併兩個事件線程池,一個工作流中的所有事件按FIFO順序在事件隊列中處理
  • 提供了更多的事件指標和事件查詢介面,便於監控和管理工作流事件

file

支持接入多個Hadoop/S3集群

3.3.0之前版本中,噹噹資源中心配置HDFS/S3,配置第三方系統任務時只能通過配置文件去進行配置,這就導致在運行時不能新增Hadoop集群或S3集群。而且配置文件過大。
新版本中這一塊有了變化:

  • 允許在元數據存儲中進行配置
  • 支持多個集群
  • 支持在運行時添加新集群
  • 不同任務可以使用不同的集群

file
file

AlertServer改進

AlertServer通過HA實現了高可用,使用單線程發送警報。這就導致需要使用額外的機器來部署AlertServer。
新版本中,允許用戶將AlertServer嵌入API伺服器,並採用多線程模型發送警報,提高了效率。

file

以上為Apache DolphinScheduler 3.3.0版本將帶來的新功能與優化項參考,具體更新內容請關註官網和GitHub發佈消息。

如何參與社區

結語

Apache DolphinScheduler 3.3.0版本帶來了多項重要更新,增強了系統的穩定性、擴展性和易用性。我們鼓勵社區成員積极參与,共同推動項目的發展。

嘉賓簡介

  • 姓名:阮文俊
  • Title:Apache DolphinScheduler/SeaTunnel/EventMesh PMC 成員
  • GitHub:ruanwenjun
  • 就職經歷:白鯨開源/eBay/拼多多
  • 專業領域:專註於分散式系統和微服務中間件

本文由 白鯨開源 提供發佈支持!


您的分享是我們最大的動力!

-Advertisement-
Play Games
更多相關文章
  • 一:Pod介紹 pod資源的各種配置和原理 關於很多yaml文件的編寫,都是基於配置引出來的 1:pod的結構和定義 每個Pod中都可以包含一個或者多個容器,這些容器可以分為2大類: 1:用戶所在的容器,數量可多可少(用戶容器) 2:pause容器,這是每個pod都會有的一個跟容器,作用有2個 1、 ...
  • 記錄一下 今天突然發現之前的小米妙享用不了 百度了一下才知道澎湃上線後 這玩意兒好像就沒用了; 所以找了一圈替代品,發現了小米電腦管家這個東西內置了HyperConnect跨端智聯,但是這玩意兒又不能直接安裝,又找了一圈怎麼安裝; 原文鏈接:非小米電腦安裝小米電腦管家-雪餅 (xue6ing.cn) ...
  • FAT32是從FAT12、FAT16發展而來,目前主要應用在移動存儲設備中,比如SD卡、TF卡。隱藏的FAT文件系統現在也有被大量使用在UEFI啟動分區中。 為使文章簡單易讀,下麵內容特意隱藏了很多實現細節,關於分區、格式化等相關的內容,可以查看之前的文章: 文件系統(一):存儲介質、原理與架構 文 ...
  • 一、邏輯地址和物理地址 1.1 含義:邏輯地址和物理地址是電腦記憶體管理中的兩個核心概念,它們在電腦系統中扮演著不同的角色。 邏輯地址(Logical Address),也稱為虛擬地址(Virtual Address),是由操作系統提供給程式使用的地址。這些地址是在程式中使用的,但並不是實際存在的 ...
  • 文章參考:https://gitee.com/socbis/linux-lvgl lvgl on linux Frame buffer 主機環境: Ubuntu 18.04 lvgl 8.0.1 獲取源碼並運行demo 獲取源碼 需要3樣東西來構建demo : lvgl核心控制項庫: 從此處獲取源碼 ...
  • 大家好,我是 Java陳序員。 今天,給大家分享下在 Linux 環境中如何安裝卸載 MySQL. 關註微信公眾號:【Java陳序員】,獲取開源項目分享、AI副業分享、超200本經典電腦電子書籍等。 MySQL 安裝 準備一臺 Linux 伺服器 下載 Linux 版 MySQL 安裝包 下載地址 ...
  • GeminiDB PITR執行數據快照業務無感,通常可在5分鐘以內恢復到指定時間點,有效解決傳統備份方案時間長、恢復粒度大等痛點問題。 ...
  • 引言 在數據驅動的世界中,企業正在尋求可靠且高性能的解決方案來管理其不斷增長的數據需求。本系列博客從一個重視數據安全和合規性的 B2C 金融科技客戶的角度來討論雲上雲下混合部署的情況下如何利用亞馬遜雲科技雲原生服務、開源社區產品以及第三方工具構建無伺服器數據倉庫的解耦方法。 本篇博客著重探討 EMR ...
一周排行
    -Advertisement-
    Play Games
  • 移動開發(一):使用.NET MAUI開發第一個安卓APP 對於工作多年的C#程式員來說,近來想嘗試開發一款安卓APP,考慮了很久最終選擇使用.NET MAUI這個微軟官方的框架來嘗試體驗開發安卓APP,畢竟是使用Visual Studio開發工具,使用起來也比較的順手,結合微軟官方的教程進行了安卓 ...
  • 前言 QuestPDF 是一個開源 .NET 庫,用於生成 PDF 文檔。使用了C# Fluent API方式可簡化開發、減少錯誤並提高工作效率。利用它可以輕鬆生成 PDF 報告、發票、導出文件等。 項目介紹 QuestPDF 是一個革命性的開源 .NET 庫,它徹底改變了我們生成 PDF 文檔的方 ...
  • 項目地址 項目後端地址: https://github.com/ZyPLJ/ZYTteeHole 項目前端頁面地址: ZyPLJ/TreeHoleVue (github.com) https://github.com/ZyPLJ/TreeHoleVue 目前項目測試訪問地址: http://tree ...
  • 話不多說,直接開乾 一.下載 1.官方鏈接下載: https://www.microsoft.com/zh-cn/sql-server/sql-server-downloads 2.在下載目錄中找到下麵這個小的安裝包 SQL2022-SSEI-Dev.exe,運行開始下載SQL server; 二. ...
  • 前言 隨著物聯網(IoT)技術的迅猛發展,MQTT(消息隊列遙測傳輸)協議憑藉其輕量級和高效性,已成為眾多物聯網應用的首選通信標準。 MQTTnet 作為一個高性能的 .NET 開源庫,為 .NET 平臺上的 MQTT 客戶端與伺服器開發提供了強大的支持。 本文將全面介紹 MQTTnet 的核心功能 ...
  • Serilog支持多種接收器用於日誌存儲,增強器用於添加屬性,LogContext管理動態屬性,支持多種輸出格式包括純文本、JSON及ExpressionTemplate。還提供了自定義格式化選項,適用於不同需求。 ...
  • 目錄簡介獲取 HTML 文檔解析 HTML 文檔測試參考文章 簡介 動態內容網站使用 JavaScript 腳本動態檢索和渲染數據,爬取信息時需要模擬瀏覽器行為,否則獲取到的源碼基本是空的。 本文使用的爬取步驟如下: 使用 Selenium 獲取渲染後的 HTML 文檔 使用 HtmlAgility ...
  • 1.前言 什麼是熱更新 游戲或者軟體更新時,無需重新下載客戶端進行安裝,而是在應用程式啟動的情況下,在內部進行資源或者代碼更新 Unity目前常用熱更新解決方案 HybridCLR,Xlua,ILRuntime等 Unity目前常用資源管理解決方案 AssetBundles,Addressable, ...
  • 本文章主要是在C# ASP.NET Core Web API框架實現向手機發送驗證碼簡訊功能。這裡我選擇是一個互億無線簡訊驗證碼平臺,其實像阿裡雲,騰訊雲上面也可以。 首先我們先去 互億無線 https://www.ihuyi.com/api/sms.html 去註冊一個賬號 註冊完成賬號後,它會送 ...
  • 通過以下方式可以高效,並保證數據同步的可靠性 1.API設計 使用RESTful設計,確保API端點明確,並使用適當的HTTP方法(如POST用於創建,PUT用於更新)。 設計清晰的請求和響應模型,以確保客戶端能夠理解預期格式。 2.數據驗證 在伺服器端進行嚴格的數據驗證,確保接收到的數據符合預期格 ...